研究課題
基盤研究(C)
国立国会図書館関西館の近代デジタルライブラリでは明治大正昭和初期の近代書籍約30万点が画像ベースで利用できる。本研究ではこの貴重なデジタルアーカイブを有効利用するための自動テキスト化を、既存の手書き文字認識技術を利用して行った。また誤認識した漢字を認識システムに迅速に知らせるための利用者用ポータルサイトも開発した。さらに裏抜け除去やルビ除去等、これまでに知られていなかった問題点にも解決の道筋を示した。
すべて 2012 2011 2010 2009
すべて 雑誌論文 (6件) (うち査読あり 3件) 学会発表 (6件)
情報処理学会数理モデル化と問題解決研究会研究報告
http://www.bookpark.ne.jp/cm/ipsj/search.asp?flag=6 & keyword=IPSJ-MPS12087034 & mode=PDF
進化計算学会進化計算シンポジウム2011予稿集
巻: MPS-87-31
Proceedings of the 2011 International Conference on Parallel and Distributed Processing Techniques and Applications
巻: Vol.2 ページ: 727-732
巻: MPS-82-14
http://www.bookpark.ne.jp/cm/ipsj/search.asp?flag=6 & keyword=IPSJ-MPS11082014 & mode=PDF
巻: MPS-81-35
Proceedings of the 2009 International Conference on Parallel and Distributed Processing Techniques and Applications
巻: Vol.2 ページ: 728-734