研究課題/領域番号 |
03558007
|
研究機関 | 京都大学 |
研究代表者 |
池田 克夫 京都大学, 工学部, 教授 (30026009)
|
研究分担者 |
西村 真一 三田工業株式会社, 技術部, 開発研究職
渡辺 正子 京都大学, 工学部, 教務職員 (70127158)
大田 友一 筑波大学, 電子・情報工学系, 助教授 (50115804)
廣瀬 勝一 京都大学, 工学部, 助手 (20228836)
美濃 導彦 京都大学, 工学部, 助教授 (70166099)
|
キーワード | 自由書式文書 / 文書画像 / デ-タベ-ス / 文字認識 / 検索索引 |
研究概要 |
当年度は、検索索引を自動生成する自由書式文書画像デ-タベ-ス構築のための環境を整えることを中心に研究を進めた。当年度に導入した強力なグラフィクス機能を持つワ-クステ-ション上で、デ-タベ-ス検索のためのユ-ザインタフェ-スの構築を行った。検索索引の自動生成のための文書、画像理解のアルゴリズムや方式の研究を行った。また、本研究では、製品カタログのデ-タベ-スを自動生成するシステムのプロトタイプ作成を行うので、検索索引の生成や検索に、製品カタログの色情報を利用することも考慮して研究を行った。具体的な研究成果を以下にあげる。 1.文字抽出の際に生じる、文字の分離、接触などを文字認識、文字の外接矩形の縦横比を利用することにより、検出、訂正することを可能にした。 2.キ-ワ-ドを、意味内容により、限定キ-ワ-ド、関連キ-ワ-ド、非限定・非関連キ-ワ-ドに分類し、それぞれに対して異なる抽出処理を適用した。 3.文字と写真の重なりあったカラ-の文書画像から、色情報を利用して文字を抽出する手法を実現した。これは文書の意味に依存しない汎用的な手法である。 4.人間とのインタフェ-スからみた使いやすい検索索引を検討し、カラ-自由書式文書画像の概略画による検索手法を実現した。これは文書の意味に依存しない汎用的な手法である。この手法が、文書に関する人間の記憶が曖味な時にも有効であることを確認した。 5.キ-ワ-ド自動抽出処理における文字認識誤りを考慮した曖味な検索を行うために、認識候補文字を複数保持し、候補順位を用いて類字度判定を行う検索手法を実現した。
|