研究課題/領域番号 |
15500097
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知覚情報処理・知能ロボティクス
|
研究機関 | 東北大学 |
研究代表者 |
阿曽 弘具 東北大学, 大学院・工学研究科, 教授 (10005522)
|
研究分担者 |
大町 真一郎 東北大学, 大学院・工学研究科, 助教授 (30250856)
後藤 英昭 東北大学, 情報シナジーセンター, 助教授 (40271879)
岩村 雅一 大阪府立大学, 大学院・工学研究科, 助手 (80361129)
|
研究期間 (年度) |
2003 – 2005
|
研究課題ステータス |
完了 (2005年度)
|
配分額 *注記 |
3,700千円 (直接経費: 3,700千円)
2005年度: 1,300千円 (直接経費: 1,300千円)
2004年度: 1,200千円 (直接経費: 1,200千円)
2003年度: 1,200千円 (直接経費: 1,200千円)
|
キーワード | 文字認識 / 文書認識システム / 学習認識システム / 認識手法統合手法 / 信頼性評価 / 図表認識 / 統計的パターン認識 / 特徴ベクトル |
研究概要 |
本研究では自律的に学習していく機能を有する文書認識システムの構築を目指し基礎的成果を得た。 1.認識アルゴリズムの統合について (1)文字特徴量空間における同一カテゴリ文字集団の記述法として、超球領域、超楕円体領域、超平行体領域、超凸多面体領域による記述法を導入し、内部構造を様々な角度から分析する基盤を与えた。カテゴリ領域間の関係把握のため、各領域間の分離の度合および重なり方の分析法を与え、それらをもとに信頼度を考え、認識結果を統合する手法を検討した。整合性評価における可変パラメータの自律的学習で高精度化を図る手法を提案した。 (2)複数の認識アルゴリズムの統合手法としてアンサンブル学習を用いる方法、類似文字識別のために複合識別システムについて、基礎的検討を行った。 2.認識理論・認識システムについて (1)特徴抽出に独立成分分析が有効で、認識には主成分分析が有効であることを明らかにした。 (2)部分空間法における原点位置の影響を調査した。 (3)ベーズ予測分布による認識手法において、字種毎にサンプル数が違うことに起因する偏りの分析法を与え、その補正方法を明らかにした。 (4)ウェブ上の画像文書に対して、文書構造解析システムを基本にしてウェブ上にある複数の認識エンジンを活用して認識するためのプラットホームを構築した。 3.文書レイアウト解析に関して (1)連結成分追跡によるグラフ認識手法及びその追跡手法の高速化手法を開発した。 (2)カラー印刷文書における同一色のスクリーンパターンが、文字抽出におけるノイズとなることから、スクリーンパターン除去手法を開発した。 (3)ビデオ映像等の低解像度画像中からの文字列抽出手法を開発した。 (4)局所特徴に投票する原理を考案し、孤立文字を抽出する新しい手法を提案した。
|