2003 Fiscal Year Annual Research Report
手書き文字認識を援用する古文書読解支援システムの構築
Project/Area Number |
14580432
|
Research Institution | Osaka Electro-Communication University |
Principal Investigator |
梅田 三千雄 大阪電気通信大学, 総合情報学部, 教授 (30213490)
|
Keywords | 古文書 / 天保郷帳 / 宗門改帳 / 文字認識 / 文字切り出し / 特徴抽出 / 細線化 / ニューラルネットワーク |
Research Abstract |
手書き文字認識を援用する古文書読解支援システムの構築を目指して、本年度は次の3項目について研究を進めた。 (1)古文書画像データベースの精緻化 システム構築の例題として作成した2種類の古文書画像データベース、つまり初心者を対象とした「天保郷帳」と中級者を対象とした「宗門改帳」データベースについて、動的なしきい値設定法の導入に基づく2値化手法と雑音除去手法を適用し、データベース画像の精緻化を図るとともに、認識処理に利用する部首データベースを作成した。 (2)キャラクタスポッティングの研究 初心者の古文書読解の支援システムに組み込む文字認識手法として、指示した特定の文字だけを認識して抽出するキャラクタスポッティング技術に着目し、加重方向指数ヒストグラムによる特徴抽出と自己想起型ニューラルネットワークによる認識処理から成る高精度スポッティング法を提案して、シミュレーション実験により、その有効性を確認した。 (3)背景領域の細線化に基づく文字切り出しと認識の研究 中級者の古文書読解を支援する文字認識システムとして、古文書特有の続け文字や文字の食い込みに積極的に対処する文字切り出し手法を提案した。その手法は、文字列の背景領域に細線化処理を施して分割候補点を抽出し、認識処理を援用しながら領域の統合を行って文字パターンを個別に切り出すものである。天保郷帳の石高文字列を例にとって、本手法に基づく文字認識により、98.52%の個別文字認識率と90.24%の文字列認識率が得られることを明らかにした。
|
Research Products
(1 results)