研究課題/領域番号 |
23300072
|
研究機関 | 九州大学 |
研究代表者 |
内田 誠一 九州大学, システム情報科学研究科(研究院, 教授 (70315125)
|
研究分担者 |
馮 尭楷 九州大学, システム情報科学研究科(研究院, 助教 (60363389)
|
研究期間 (年度) |
2011-04-01 – 2014-03-31
|
キーワード | 手書き文字列認識 / 局所特徴 / セグメンテーション / パターン認識 |
研究概要 |
本年度は,年度当初の予定通りの進捗を得た.すなわち,これまでに培ってきたpart-based 認識の基本特性に関するノウハウを基に,文字列の認識への拡張ついて主に取り組んだ.また並行して,タブレット等を介して入力される文字パターンをpart-based認識する方式(part-basedオンライン文字認識)の検討を行った. まず,part-based文字列認識については,昨年度後半から取り組みにより,文字列を単文字に分割する処理,いわゆるセグメテーション処理が非常に困難な場合に対する頑健性がわかっている.例えば,隣接文字が強く接触していたり,各文字が大きく傾いているような場合に対する頑健性である.これは,part-based文字認識が,セグメンテーション以前に,文字を局所領域単位に細分割していることからくる特性であり,大きな利点であるといえる.郵便番号数字列を対象とした文字列認識実験により,この頑健性を確認した.なお,この結果の一部についてはICPR2012(パターン認識に関する世界最大の国際会議)にて発表された.なお,現在part-based文字列認識について,情景内の多様なフォントによる文字列への適用を開始した. part-basedオンライン文字認識は,上記の文字列画像を対象とした場合よりもさらに困難な状況である.すなわち,オンラインの場合,文字の局所領域は単純な線分になるために,文字の特徴が失われ,認識率の低下が起こる一方で,筆順変動などの大局的な変動について著しく頑健と考えられる.英字および漢字を対象とした実験により,この頑健性を確認した.なお,この結果の一部についてはIGS2013(手書き全般に関する歴史ある国際会議)にて発表予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
上述の通り,H24年度当初に計画されていたことは遂行し,成果として国際会議および学術雑誌にて発表するに至っている.さらに,既に情景内文字列認識に着手していることから,当初の計画以上と考える.
|
今後の研究の推進方策 |
本年度は、これまで検討を重ねてきたpart-based文字認識技術による単文字認識および文字列認識応用についてさらなる展開を行う.具体的には,これまでの手書きによる文字に加え,昨今ニーズが高まっている情景内の文字および文字列を対象としたpart-based認識を試みる. part-based文字認識とは,上述の通り,文字画像を多数の部分画像に分解し,各部分画像での認識を行い,得られる複数の部分画像での認識結果を統合することによる,画期的な文字認識手法である.文字の大局的構造を用いずに認識を行うので,大局的構造が壊れてしまうような大きな変形にも頑健な認識が実現する. こうした大きな変形は,情景内の文字にも多く発生する.看板上の文字に見られる様々な装飾もこうした変形である.また部分的な影による輝度変化や,オクルージョン,射影変換などによっても,大局的構造を破壊する変形は生じる.こうした情景内文字の認識について,従来の研究では何とか通常のOCR技術で認識できるように,前処理で正規化を行う(すなわち通常の文字と極力類似するように画像変換を施す)ことが多かった.これに対し,我々の本年度の研究では文字を部分画像に断片化するというpart-based認識のアプローチを適用することで,この難問に取り組む.
|