研究課題
若手研究(B)
本課題では、静止画像ではなく動画像を用いた文字列(テキスト)の認識を検討してきた。動画像の利用により認識できるテキストの長さの制約を排除できると考えられる。また動画像中のオーバーラップした領域を用いることにより、モザイキングにより生成されるテキスト画像の質の向上が期待できる。昨年度の検討により、モザイキングと文字認識を同時に行うという基本アルゴリズム(mosaicing-by-recognition)を確立した。ただし、撮影中の手ぶれにより文字が射影変換などの幾何変形を受けること、スキャナに比べて低解像度画像となること、さらに画像からの文字行の切り出し(セグメンテーション)を検討する必要があった。最終年度である今年度は、基本アルゴリズムの性能向上を目指し、撮影時に様々な劣化を受けた文字(スキャナによって取得される従来の文字パターンに対照して「実環境文字」と呼ばれる)を如何に認識するかに重点を置き、様々な角度から検討を行った。すなわち、本手法は実環境文字認識処理を内包しており、その巧拙がモザイキングを含めた全体のパフォーマンスを左右する。そこで、実環境文字の幾何変換への対応、セグメンテーションの問題、解像度の問題を解決するための幾つかの試みを行った。特筆すべきは幾何変形下でも可読となるように文字自身に工夫を施しておくという試みである。OCRフォントの現代版とも言えるこの試みは成功裏に終了し、評価実験によりその有効性(強い射影変換を受けた英大文字234サンプル中233を正答)を実証した。以上の結果は様々な国際会議、学術誌において公表済みもしくは公表予定である。また、昨年度までに検討してきた基本アルゴリズムについては、当該分野で評価の高い国際学術誌「Pattern Recognition」に投稿済みであり、現在(ほとんど語句訂正程度の)条件付採録となっている。
すべて 2007 2006 2005
すべて 雑誌論文 (12件)
電子情報通信学会論文誌(D) J90-D
ページ: 460-470
110007380675
電子情報通信学会論文誌(D) J90-D(In press)
110007380811
Proceedings of 18th IAPR International Conference on Patter Recognition 2
ページ: 1134-1137
Proceedings of 18th IAPR International Conference on Pattern Recognition 2
ページ: 1098-1101
ページ: 986-989
Structural, Syntactic, and Statistical Pattern Recognition,(Lecture Notes in Computer Sciences) 4109
ページ: 136-144
110004662908
電子情報通信学会論文誌(D) vol.J89-D・no.2
ページ: 344-352
Proc.8th Int.Conf. on Document Analysis and Recognition 2
ページ: 904-908
First International Workshop on Camera-Based Document Analysis and Recognition 1
ページ: 3-9
IEICE Transactions on Information & Systems vol.E88-D・no.8
ページ: 1781-1790
110003214378
画像の認識理解シンポジウム論文集 1
電子情報通信学会論文誌(D-II) vol.J88-D-II・no.7
ページ: 1187-1195