2005 Fiscal Year Annual Research Report
Project/Area Number |
15500097
|
Research Institution | Tohoku University |
Principal Investigator |
阿曽 弘具 東北大学, 大学院・工学研究科, 教授 (10005522)
|
Co-Investigator(Kenkyū-buntansha) |
大町 真一郎 東北大学, 大学院・工学研究科, 助教授 (30250856)
後藤 英昭 東北大学, 情報シナジーセンター, 助教授 (40271879)
岩村 雅一 大阪府立大学, 大学院・工学研究科, 助手 (80361129)
|
Keywords | 文字認識 / 文書認識システム / 学習認識システム / 認識手法統合手法 / 信頼性評価 / 図表認識 / 統計的パターン認識 |
Research Abstract |
本研究は、複数の認識アルゴリズムの能力を互いに補完させた統合システムで自律的に学習する機能をもたせた文書認識システムの構築を目指している。 本年度は、文字特徴量空間の内部構造の分析方法を実現するプログラムを作成し、日本語字種3134種の特徴量データベースを用いて具体的分析を行った。さらに、文字特徴量空間における文字カテゴリの同定のために、学習用データから決まる同一カテゴリ文字集団の記述法として、凸包領域、超球領域、超楕円体領域、超平行体領域による記述法を導入し、内部構造を様々な角度から分析する基盤を与えた。これらの記述にはそれぞれ固有の可変パラメータがあり、認識結果の信頼性に影響を与える。この可変パラメータの学習方法を与えた。また、複数の認識アルゴリズムを統合する一つの手法であるアンサンブル学習を用いる方法について、基礎的検討を行った。 文書認識手法は、ウェブ上にある様々な画像文書(pdfなどを含む)を文字コードベースの文書に変換するために適用できる。ウェブ上の画像文書に対して、文書構造解析システムを基本にしてウェブ上にある複数の認識エンジンを活用して認識するためのプラットホームを構築した。 本学習認識システムのための文書レイアウト解析に関して、スクリーントーンの除去手法を改良した。また、掛け時計の数字のように孤立した文字の抽出手法について改良した。デジタル写真による画像だけでなく、ビデオ映像の中の文字列を抽出する手法を開発した。 本年度は研究計画の最終年度であるが、当初の目的の基礎的部分の構築まで実現した。今後さらに検討し、自律的に学習する文書認識システムの構築を目指す。
|
Research Products
(6 results)