研究概要 |
本研究課題は,文字の大局的構造を破棄して局所部分に断片化しても,依然として正しく文字を認識できるという新事実を利用して,従来の方法論のボトルネックであった,個別文字レベルで生じる変形への耐性,および文字切り出し(セグメンテーション)の困難性,の2点において,ブレイクスルーの実現を目的としている.この目的の下でH23年度は,当初計画にあった,part-based認識の理論構築および,part特徴空間の解析,それに伴う計算量増加への対策(高速化)という個別文字レベルの問題に加え,セグメンテーション問題を内包する文字列認識について,手法実装および評価実験を行った.具体的には以下のとおりである. 第一に,理論構築およびpart特徴空間の解析については,大量のpartの分布の解析ならびにpart間の類似度の吟味,および各partレベルの認識結果の統合法の吟味を行った.そしてその分布の特性を活かして,不要なpartの除去による高速化および認識率向上,ならびにクラス固有partの発見を行った.partが為す分布はクラス間で大きくかつ多様にオーバーラップしているという予想を,実験を通して実証した.また変形耐性を評価するべく,一部が欠けた文字の認識実験も行った. 第二に,厳密なセグメンテーション不要な文字列認識に着手した.文字列から局所特徴点群を抽出し、各特徴点について単文字の場合と同様に最近傍認識を行い,その結果を,文字列画像平面内で部分統合する方法を試みた.その結果,接触文字や分離文字,激しい傾きなど,従来の文字列認識法では困難であった対象についても,70%程度の場合において正しく構成文字を認識できることを示した.また,今後の展開のために,誤認識解析を行った. 以上に加え,part-basedの考え方を,オンライン文字認識および文字傾き補正法に適用,実験を通して,その性質および性能を定量的・定性的に評価した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初計画のうち,多クラス文字(漢字)認識以外のすべての項目について,予定通り履行できた.特に,研究実施の過程で特に重要と判断した文字列認識については,当初の計画以上に注力し,国際会議に論文投稿できるレベルまでの進捗を得た.(平成24年4月7日投稿済み).また以上に加えて,part-basedオンライン文字認識にも,予定を前倒しして着手し,すでに学会発表まで行っている.以上を勘案し,上記のとおりの達成度と評価した.
|
今後の研究の推進方策 |
Part-basedアプローチによる文字「列」の認識は,本研究課題の最重要課題の一つである.今年度よりすでに検討を開始して,予備的結果を得るに至っている.セグメンテーション困難な場合に対して所期の性能が得られることはわかったが,一方で,隣接文字間領域において,認識結果が不安定になり,その結果,正しい文字列認識結果が得られない場合があることも把握した.今年度はこの問題点について特に注力し,解決を図る.具体的には,その不安定区間の把握および積極的除外,ならびにpart(局所領域)の表現方式(特徴抽出)改良によるpartレベル認識率改善を実施する.また並行して,オンラインpart-based認識,part-basedによる文字形状補正についても,手法実装,定量的・定性的性能検証を行う.
|