研究課題/領域番号 |
11558045
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 展開研究 |
研究分野 |
情報システム学(含情報図書館学)
|
研究機関 | 国際日本文化研究センター |
研究代表者 |
山田 奨治 国際日本文化研究センター, 研究部, 助教授 (20248751)
|
研究分担者 |
梅田 三千雄 大阪電気通信大学, 情報工学部, 教授 (30213490)
川口 洋 帝塚山大学, 経営情報学部, 助教授 (80224749)
柴山 守 大阪市立大学, 学術情報総合センター, 教授 (10162645)
加藤 寧 東北大学, 大学院・情報科学研究科, 助教授 (00236168)
石谷 康人 (株)東芝, 研究開発センター, 主任
|
研究期間 (年度) |
1999 – 2001
|
研究課題ステータス |
完了 (2001年度)
|
配分額 *注記 |
10,300千円 (直接経費: 10,300千円)
2001年度: 2,100千円 (直接経費: 2,100千円)
2000年度: 5,300千円 (直接経費: 5,300千円)
1999年度: 2,900千円 (直接経費: 2,900千円)
|
キーワード | 古文書 / 文字認識 / OCR / 電子辞書 / 文字データベース / 文字切り出し |
研究概要 |
本研究では、つぎのような成果を得ることができた。 1.古文書文字認識手法の基礎的研究 古文書文字に特有な文字認識機能と文字切り出し方法について検討した。限定された文字種のデータに対して既存の日本語手書き文字認識技術を適用し、95%を超える認識率が得られることを確認すると同時に、文字切り出し及び正規化に関して新しい手法を開発した。 2.古文書文字認識研究のためのデータベース作成 古文書文字認識研究を推進するための、25万字に及ぶ古文書文字データベースを完成させ、その一部をすでに公開している。 3.古文書解読支援システムのユーザインタフェースの開発 古文書解読知識を利用した証文類の翻刻支援システムと古文書翻刻支援のための電子辞書のプロトタイプを実装した。前者はn-gram情報を使って不明文字の正解候補を提示するシステムで、利用試験の結果、その有用性が確認された。後者のプロトタイプには2種類ある。第1は、文字コードからくずし字を検索し、さらに例示された文字と類字した文字をオンラインとオフラインの文字認識技術の応用により検索する機能を持っている。第2のプロトタイプは、タブレット入力された文字と外形が似たくずし字をオフライン文字認識によって検索する機能を持っている。
|