2015 Fiscal Year Annual Research Report
文字領域推定を行わない情景画像中の文字認識アルゴリズムの構築
Project/Area Number |
26540124
|
Research Institution | Tohoku University |
Principal Investigator |
和泉 勇治 東北大学, 情報科学研究科, 准教授 (90333872)
|
Project Period (FY) |
2014-04-01 – 2016-03-31
|
Keywords | 文字認識 / 輪郭線 / 情景画像 / 畳み込みニューラルネットワーク |
Outline of Annual Research Achievements |
本研究課題は,認識的処理を可能な限り排除した情景画像中の文字認識アルゴリズムの構築を目的としている.情景画像中の文字認識技術は,画像中の文字領域推定と推定領域の字種判別の2段階の認識処理により実現されることが多い.本研究課題では,文字領域推定やストローク推定などの認識的処理を可能な限り排除し,画像中の文字の字種を判断する新しい文字認識アルゴリズムの構築を目的とし,画像から抽出される全特徴量を抽出し,その特徴量の分布から直接字種を決定するモデルを提案した.更に,背景部分が認識対象に対しノイズとして働くことを指摘し,それを効率的に排除するための畳み込みニューラつネットワークを利用した特徴選択についても提案した. 特徴量の分布から直接認識するモデルに関しては,画像中に存在する全ての閉曲線からその輪郭を特徴量とし,隣接する輪郭間の位置関係,大きさなどを定量的に評価するスコアを提案した.この全ての閉曲線を認識対象とする方式により,画像中の文字領域の推定処理を排除した認識アルゴリズムを構築することが出来た.認識精度に関しては,ICDAR2003のデータセットによる評価を行い既存研究と同等の認識精度を達成可能であることを確認した.しかし,輪郭線の抽出ミスによる認識漏れが存在し,より適切な画像処理や,複数の輪郭線抽出などを組み合わせることなどが必要であると判明した. また,一部の輪郭に背景の輪郭がノイズとして入り込み,適切に形状を評価出来ない問題点が明らかとなった.この問題に対し,文字画像と非文字画像を学習した畳込みニューラルネットワークを利用したフィルタ処理を適用し,ノイズの提供により誤認識の軽減を実現した.
|
Research Products
(1 results)