|
|
少數民族文字識別系統研制成功http://www.sina.com.cn 2007年03月13日 07:15 中國質量新聞網
近日,“多體蒙古文(包括混排漢英)印刷文檔識別暨統一平臺少數民族文字識別系統”通過了技術鑒定。 該系統能識別多種印刷字體的蒙古文字符號和文檔,并能識別蒙漢英混排的文檔,是集版面分析、文本行字切分、識別、縱向文檔圖文對照編改等技術于一體的蒙古文文檔識別實用系統,解決了多字體蒙古文漢英混排文本切分和識別問題。蒙古文、藏文、維吾爾文等6種少數民族文字的紙出版物要轉換成電子出版物,今后可以不再靠人工錄入,只要經“統一平臺少數民族文字識別系統”處理,印刷文檔的掃描圖像就會自動生成可編輯檢索的電子文檔。 據介紹,該系統是全球首款在統一平臺上支持我國主要少數民族文字文檔的識別系統。系統在漢字和英文文檔識別的基礎上將4種類型6種文字的少數民族文字,即蒙古文、藏文、維吾爾文、哈薩克文、朝鮮文和柯爾克孜文(混排漢英)。文檔識別綜合集成在一個統一的平臺系統中,使我國最主要的少數民族文字文檔能夠自動識別輸入計算機。該系統軟件產品采用國際標準編碼,系統結構具有良好的擴展性,還支持阿拉伯文的識別。 該項目實現了在統一平臺上蒙、藏、維、哈、柯、朝(混排漢英)文檔識別的綜合集成,對促進我國少數民族語言文字的信息化建設具有重要意義。 作者:克 集
|
不支持Flash
不支持Flash
|