研究課題
本年度は、これまで検討を重ねてきたpart-based文字認識技術による単文字認識および文字列認識応用についてさらなる展開を行った.具体的には,これまでの手書きによる文字に加え,昨今ニーズが高まっている情景内の文字を対象としたpart-based認識を試みた.part-based文字認識とは,文字画像を多数の部分画像に分解し,各部分画像での認識を行い,得られる複数の部分画像での認識結果を統合することによる,画期的な文字認識手法である.文字の大局的構造を用いずに認識を行うので,大局的構造が壊れてしまうような大きな変形にも頑健な認識が実現する.こうした大きな変形は単文字内でも発生する.特に情景内に存在する飾り文字や多様なフォントも,パターンとしては基本の文字形状を大きく変形したものであると言える.これに対し,part-based文字認識技術の枠組を用いれば,こうした大規模な変形が生じたとしても,部分画像に分解してしまえば,変形の悪影響は該当部分を含んだ少数の部分画像に限定される.すなわち残り大部分の部分画像については,変形のなかった場合と同様の認識が可能であり,従って頑健性が担保される.さらに飾り文字のpartをあらかじめ準備しておくことで,それを組合せてできた別の飾り文字も認識できる可能性が広がる.実際,様々なフォントを用いた認識実験の結果,通常のOCR(56%)よりも高い認識率(73%)が得られることが確認された.すなわち誤認識を2/3にまで低減できた.こうした情景内文字の認識は,携帯カメラの普及により広く重要視されるに至っており,本研究もその進展に寄与する貢献を果たしたと言える.
25年度が最終年度であるため、記入しない。
すべて 2013 その他
すべて 雑誌論文 (4件) (うち査読あり 3件) 備考 (1件)
IEICE Transactions on Information & Systems
巻: vol.E96-D,no.7 ページ: 1503-1512
Frontiers of Computer Science
巻: vol.7,no.4 ページ: 514-525
10.1007/s11704-013-2297-x
Proceedings of The 12th International Conference on Document Analysis
巻: 1 ページ: 170-174
Proceedings of the 16th International Graphonomics Society Conference
巻: 1 ページ: 66-69