2014 Fiscal Year Research-status Report
文字領域推定を行わない情景画像中の文字認識アルゴリズムの構築
Project/Area Number |
26540124
|
Research Institution | Tohoku University |
Principal Investigator |
和泉 勇治 東北大学, 情報科学研究科, 准教授 (90333872)
|
Project Period (FY) |
2014-04-01 – 2016-03-31
|
Keywords | 文字認識 / 画像中の文字認識 / 文字領域推定 / シェープコンテキスト |
Outline of Annual Research Achievements |
風景画像中の文字認識を実現するために,画像中の特徴量抽出アルゴリズムの検討,抽出特徴量を利用した基礎的認識アルゴリズムの構築と認識特性の調査を行った. 本研究は,文字領域の推定処理を排除した認識アルゴリズムの構築を目的としているため,認識対象画像の全てから特徴量を抽出する.本年度では幾つかの特徴量を検討したが,画像を領域分割し,各領域の境界線を構成する閉曲線をShape Contextをベースとした二次元ヒストグラムを利用した形状の特徴量を主に利用し認識実験を行った. 画像中の文字の特性とした,ある文字の周辺には大きさの近い他の文字が存在し,形状のみではなく,閉曲線の相互の位置関係,相対的な大きさなども認識の高精度化のために重要な特徴量であると考えた.そこで本年度では,形状の特徴量以外に,相対的な大きさ,位置関係を評価可能な特徴量を導入し,それらを利用した基本的認識アルゴリズムを構築した. 認識アルゴリズムにおいては,特性の異なる特徴量を確率分布で近似することで,分布特性の違いを吸収し,一つの評価関数で評価可能なアルゴリズムを構築した.更に,画像から抽出された複数の領域を組み合わせて一つの文字として認識するための領域組み合わせの評価方法も認識アルゴリズムに組み込むことを実現した.現時点では,基礎的認識結果を得たのみではあるが,相対的な大きさ,位置を表現する特徴量を導入することにより,文字以外の領域を排除実現し,更に,形状の特徴量のみでは誤認識となる文字を補正することが可能であることを確認することが出来た.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究計画とは異なる特徴量を利用する方針となってはいるが,本研究課題の目的実現に必要な特徴量抽出方法とそれを利用した基礎的認識アルゴリズムを構築したという点におて,おおむね順調に進展していると判断していいる.
|
Strategy for Future Research Activity |
現時点では,画素値(色)を利用した画像の領域分割を用いている.これにより抽出可能な領域と不可能な領域が存在している.特に,背景が映り込み,文字領域が明確に分離出来ない画像では,抽出されなかった領域の認識対象となならない問題点が残っている. この対処法として,文字としてある程度の確度で認識された領域の特徴を,その周辺の文字の存在の事前確率として扱うことで,画素値の情報のみでは分離不可能な領域分割・抽出が出来るのではないかと考えている.この考え方を基本として,認識対象の事前知識を導入した高精度の認識のための領域評価方式を今後の主な研究課題として取り組んでいく予定である.
|
Causes of Carryover |
当初,研究成果発表の速報性を考え国際会議での発表を予定し,旅費を計上していた.国際会議での論文発表は実現したが,業務都合により国際会議を欠席せざるを得なかったため,旅費の未使用額が大きくなってしまった.
|
Expenditure Plan for Carryover Budget |
今後の課題として残っている画像の領域分割の高度化の研究に伴う,人間による領域評価データを得るために,実験協力者への謝金の使用を想定している.また,今年度で出席出来なかった国際会議への出席など,積極的に研究成果の発表を行うための旅費として使用する予定である.
|
Research Products
(3 results)