2018 Fiscal Year Annual Research Report
Accuracy improvement of the 3D rotation angle estimation of characters by the probabilistic interpolation
Project/Area Number |
16K00236
|
Research Institution | Mie University |
Principal Investigator |
若林 哲史 三重大学, 工学研究科, 教授 (30240443)
|
Co-Investigator(Kenkyū-buntansha) |
大山 航 九州大学, システム情報科学研究院, 准教授 (10324550)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 3次元回転文字認識 / カメラベース文字認識 / 車番認識 / 3次元回転角度推定 / 日本語文字認識 |
Outline of Annual Research Achievements |
我々は、カメラベースの文字認識において、回転や透視投影により変形した文字の認識を可能とする3次元回転文字認識手法を提案している。このとき、個々の文字の3次元回転角度を推定して文字印刷面の法線ベクトルを求め、その向きでグルーピングすることで文字列を検出できるが、3次元の回転角度推定に必要な記憶容量が膨大となるため、字種の多い、漢字・かなを含む日本語を対象とすることが難しかった。 平成28年度は、特徴ベクトルの低次元化と回転角度候補の確率的補間により、記憶容量を増加させることなく文字印字面回転角度の推定精度を高めるとともに、文字候補の組み合わせと車番テンプレートのマッチングを取ることで、様々な角度から撮影された車番の認識を実現した。 平成29年度は、3次元回転により変形した文字から推定される2通りの回転角度のうち、正しい方を選択する手法を開発して回転角度推定をさらに高精度化するとともに、複数の連結成分からなるかな文字で構成される文字列の撮影画像から、組み合わせ最適化により、文字切り出し・認識・回転角度推定を行う手法について外部発表を行った。また、関連研究として、画像中の製造メーカーのロゴ切り出しと認識手法を開発し、電子情報通信学会論文誌にて発表した。 平成30年度は、複数の連結成分からなる文字の切り出しと認識を、かなから漢字にまで拡張するために、組み合わせ最適化のアルゴリズムを改良し、関連研究として、複雑な背景中のドット文字の抽出・認識、連結成分解析による文字列の言語推定手法について研究を行い、それぞれ外部発表を行った。 これらの研究成果によって、字種の多いかな・漢字に対する3次元回転文字認識が可能となった。
|
Research Products
(5 results)