Indian Government Launches A Web Based Optical Character Recognition System
Sachin Pilot, Indian Minister of State for Communications and Information Technology, has launched a new web based Optical Character Recognition (OCR) system for Hindi and Punjabi.
Explaining that this initiative will be a significant move towards the digital inclusion of differently-abled people from various linguistic backgrounds, Sachin Pilot hoped that it will also pave the way for wider usage of Indian languages in governance applications.
For people who aren’t familiar with OCR technology, it is a process through which handwritten, typewritten, or printed text is converted to electronic form. This will allow editing of printed books and documents, searching for any specific word/phrase, and also implementing techniques like machine translation or text-to-speech on it.
Along with the OCR system, Sachin Pilot also launched a text-to-speech system across six languages – Hindi, Marathi, Bangla, Telugu, Tamil, and Malayalam.
これにより、印刷された本や書類を編集することができ、その結果、特定の単語やフレーズを探したり、機械翻訳や音声合成などのテクニックも使うことができるようになる。
さらに、パイロット大臣はOCRシステムの導入と同時に、ヒンディー語、マラーティー語、ベンガル語、テルグ語、タミル語そしてマラヤーラム語の6つの言語間の音声合成システムも導入した。
さらに Sachin Pilot 氏は OCR システムとともに、ヒンディ語・マラーティー語・ベンガル語・テルグ語・タミル語・マラヤーラム語の 6つの言語に対応したテキスト読み上げシステムも発表している。
This effectively means that developers can now finally integrate this system in their software and users can listen to regional books and documents on any device which supports text-to-speech technology i.e. mobile phones, e-book readers, tablets, computers, and so on. Also, if the device sports a screen reader, users will be able to easily navigate and perform basic operations on it.
Both the systems were developed by Technology Development for Indian Language (TDIL), a program driven by India’s Department of Information Technology.
両システムは、インド語の技術開発(TDIL)によって開発され、プログラムはインドの情報技術部門によって運営されている。
この2つのシステムを開発したのは、インドの情報技術省の運営されているプログラムである、インド言語のための技術開発(TDIL)である。
両システムとも Technology Development for Indian Language (TDIL) によって開発されており、プログラムはインド政府の情報産業部によって運用される。
While the text-to-speech system has already been integrated with OCR-A font and Non Visual Desktop Access (NVDA), a free and open source screen reader for Windows OS, the Optical Character Recognition, is on showcase at TDIL Data Centre.