研究分担者 |
西村 真一 三田工業株式会社, 技術部, 開発研究職
大田 友一 筑波大学, 電子・情報工学系, 教授 (50115804)
廣瀬 勝一 (広瀬 勝一) 京都大学, 工学部, 助手 (20228836)
天野 晃 京都大学, 工学部, 助手 (60252491)
美濃 導彦 京都大学, 工学部, 助教授 (70166099)
渡辺 正子 Kyoto Univ., Integ.Media Env.Exp.Lab., Res.Assist. (70127158)
|
配分額 *注記 |
16,400千円 (直接経費: 16,400千円)
1993年度: 1,100千円 (直接経費: 1,100千円)
1992年度: 4,900千円 (直接経費: 4,900千円)
1991年度: 10,400千円 (直接経費: 10,400千円)
|
研究概要 |
本研究は,自由書式文書を対象として,データの入力時に人間が介入することなく,検索索引を自動的に生成する文書画像データベースを構築することを目的とする.本研究において得られた成果を以下に示す. ・カラー文書画像処理 同一文字列中の文字は単一色から構成されているという仮定のもとに,カラー文書画像に対して色のクラスタリングを適用した文字パタン抽出法を開発した.また,文字の輪郭に着目し,写真に重ねて書かれた文字を抽出する手法を開発した.文字パタン抽出以外の処理としては,色情報を積極的に利用した写真領域の抽出法を開発した. ・自由書式文書画像からの文字パタンの抽出 文字切り出しの誤りに対処する方法として,切り出した各文字に対して文字認識を行い,単語辞書との照合を行う手法を提案した.また,任意の傾きで書かれた文字パタン列を抽出する手法を開発した.文字認識については,文字の複雑さを表す尺度を定義し,この値と,結果の信頼できる文字認識に必要な解像度の下限との関係を明らかにした. ・文書画像の検索手法 文書画像中の各文字について複数の文字候補を蓄積し,与えられた文字列の出現位置を同定する検索アルゴリズムを提案した.また,文書画像から抽出された単語を基にして,ユーザのキーワード想起を支援する手法を開発した.また,人間とのインタフェースからみた使いやすい検索索引を検討し,カラー文書画像を概略画によって検索する手法を実現した. ・文書画像データベースのための分散並列処理 カラー文書画像データベースシステムの実行環境として,既存のLANのみを用いた分散並列処理環境を構築した.ここでは,画像処理,文字認識処理,構造解析処理といったさまざまなレベルの処理をモジュール化することによって,モジュール単位での並列実行を実現している.
|