1999 Fiscal Year Annual Research Report
手書き文字OCR技術を援用した古文書翻刻支援システムの開発
Project/Area Number |
11558045
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Research Institution | International Research Center for Japanese Studies |
Principal Investigator |
山田 奨治 国際日本文化研究センター, 研究部, 助教授 (20248751)
|
Co-Investigator(Kenkyū-buntansha) |
川口 洋 帝塚山大学, 経営情報学部, 助教授 (80224749)
梅田 三千雄 大阪電気通信大学, 情報工学部, 教授 (30213490)
柴山 守 大阪市立大学, 学術情報総合センター, 教授 (10162645)
石谷 康人 (株)東芝ディジタルメディア機器社, 主任
加藤 寧 東北大学, 大学院・情報科学研究科, 助教授 (00236168)
|
Keywords | 古文書 / 文字認識 / OCR / 文字切り出し / 文字データベース |
Research Abstract |
本研究の目的は、日本語手書き文字OCR技術を展開的に応用した、古文書翻刻支援システムを開発し、歴史学研究の現場において大きな作業量を占めている翻刻作業の負荷を軽減し、歴史学研究を支援することである。平成11年度は、(1)古文書文字認識用辞書構造の決定、(2)古文書画像入力と辞書構築、(3)文字認識部の検討について研究を進めた。(1)に関しては、「宗門改帳」(個人蔵)から採字した年齢表記部分16字種3066サンプルを文字画像データベース化を完了し、(3)の古文書文字認識実験に供している。(2)に関しては、『柳営日次記』(内閣文庫所蔵)の文字データベース化に向けた翻刻作業に着手した。また、文書画像からノイズを除去しながら手作業で文字を切り出し、翻刻文字を入力してデータベース化する作業を支援するためのインタフェースを構築した。さらに、古文書文字の自動切り出しに関する研究を進め、「伏見屋文書」の標題切り出しと『冥報記』の文字切り出しを例に、良好な結果を得た。(3)に関しては、日本語手書き文字OCRで最高の認識率を得ている文字認識エンジンを用いて、(1)で作成した「宗門改帳」年齢表記文字データの認識実験をおこない、96.67%の文字認識性能を確認できた。平成12年度は、「宗門改帳」文字画像データベースをさらに拡充させる。『柳営日次記』の文字データベース化は、継続的に取り組む。また、文字切りだし支援ツールのインタフェースを核に、自動文字切りだし機能とOCR機能を統合してゆく方法を検討する。
|
Research Products
(2 results)
-
[Publications] 山田奨治ほか: "古文書翻刻支援システム開発プロジェクト報告(1)プロジェクト概要"情報処理学会研究報告. 2000, 8. 1-8 (2000)
-
[Publications] 和泉勇治ほか: "ニューラルネットワークを用いた古文書個別文字認識に関する-検討"情報処理学会研究報告. 2000, 8. 9-15 (2000)