研究課題
我々は、カメラベースの文字認識において、回転や透視投影により変形した文字の認識を可能とする3次元回転文字認識手法を提案している。このとき、個々の文字の3次元回転角度を推定して文字印刷面の法線ベクトルを求め、その向きでグルーピングすることで文字列を検出できるが、3次元の回転角度推定に必要な記憶容量が膨大となるため、字種の多い、漢字・かなを含む日本語を対象とすることが難しかった。平成28年度は、特徴ベクトルの低次元化と回転角度候補の確率的補間により、記憶容量を増加させることなく文字印字面回転角度の推定精度を高めるとともに、文字候補の組み合わせと車番テンプレートのマッチングを取ることで、様々な角度から撮影された車番の認識を実現した。平成29年度は、3次元回転により変形した文字から推定される2通りの回転角度のうち、正しい方を選択する手法を開発して回転角度推定をさらに高精度化するとともに、複数の連結成分からなるかな文字で構成される文字列の撮影画像から、組み合わせ最適化により、文字切り出し・認識・回転角度推定を行う手法について外部発表を行った。また、関連研究として、画像中の製造メーカーのロゴ切り出しと認識手法を開発し、電子情報通信学会論文誌にて発表した。平成30年度は、複数の連結成分からなる文字の切り出しと認識を、かなから漢字にまで拡張するために、組み合わせ最適化のアルゴリズムを改良し、関連研究として、複雑な背景中のドット文字の抽出・認識、連結成分解析による文字列の言語推定手法について研究を行い、それぞれ外部発表を行った。これらの研究成果によって、字種の多いかな・漢字に対する3次元回転文字認識が可能となった。
すべて 2018 その他
すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (3件) 備考 (1件)
IEICE Transactions on Information and Systems
巻: Vol.E101-D, No.5 ページ: pp.1325-1332
https://doi.org/10.1587/transinf.2017MVP0026
http://www.hi.info.mie-u.ac.jp/publications/