研究課題/領域番号 |
11480082
|
研究種目 |
基盤研究(B)
|
研究機関 | 国際日本文化研究センター |
研究代表者 |
山田 奨治 国際日本文化研究センター, 研究部, 助教授 (20248751)
|
研究分担者 |
笠谷 和比古 国際日本文化研究センター, 研究部, 教授 (90124198)
川口 洋 帝塚山大学, 経営情報学部, 助教授 (80224749)
柴山 守 大阪市立大学, 学術情報総合センター, 教授 (10162645)
加藤 寧 東北大学, 大学院・情報科学研究科, 助教授 (00236168)
小島 正美 東北工業大学, 工学部, 助教授 (60085420)
|
キーワード | 古文書 / 文字認識 / OCR / 知識ベース / 用例デ-タベース / 文字データベース |
研究概要 |
本研究の目的は、古文書学の専門家が持つ古文書認識における認識過程のモデル化を行い、日本語手書き文字認識技術を古文書に対して適用したシステムを実装する中で、古文書解読のメカニズムを実証的に明らかにしてゆくことにある。平成11年度の研究は(1)古文書解読に関する専門家知識の構造化、(2)古文書文字認識用辞書開発、(3)古文書文字認識の検討を実施した。(1)に関しては、古文書に関する文書の形式、定型文言、文字判読方法などの専門知識を知識ベースとして構造化するために、定型文書である金子借用証文を豊富に含む「伏見屋文書」(大阪市立大学所蔵)の全文翻刻作業の40%程度を完了した。特に標題部分に関しては、用例データとして完成し、頻出表現知識の抽出のための分析に着手している。(2)に関しては、同じ「伏見屋文書」の全文字画像データベース化のための文字切り出し作業を実施している。(1)の成果と合わせて、「伏見屋文書」の標題部分に関しては、用例データと文字画像データを連結した形で、平成12年度の早期に完成できる見通しが得られた。(3)に関しては、日本語手書き文字認識で使われた方法をそのまま適用して、予備実験を遂行している。平成12年度は、「伏見屋文書」の用例・文字画像データベースを完成させ、知識抽出を行う予定である。古文書文字認識についても、さらに研究を進める。
|