研究課題/領域番号 |
16K00236
|
研究機関 | 三重大学 |
研究代表者 |
若林 哲史 三重大学, 工学研究科, 教授 (30240443)
|
研究分担者 |
大山 航 三重大学, 工学研究科, 助教 (10324550)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 文字認識 / カメラベース / 3次元回転 / 回転角度推定 / 車番認識 / グラフマッチング |
研究実績の概要 |
我々は、カメラベースの文字認識において、回転や透視投影により変形した文字の認識を可能とする3次元回転不変文字認識手法を提案している。この手法は、回転した文字を生成して字種ごと回転角度ごとに学習しておくことで、一文字単位で3次元の回転文字認識と回転角度推定を行う手法である。しかし、3次元の回転角度推定に必要な記憶容量は膨大であるため、字種の多い日本語を対象とすることが難しかった。そこで本研究では、回転角度の推定は文字種を特定した後に行うことに着目し、特徴ベクトルを低次元化し、識別関数を修正2次識別関数から線形識別関数に変更することで、記憶容量と大幅に削減できることを確認した。また、従来はx, y, z軸まわりにそれぞれ10°刻みで設定された角度クラスのいずれかに分類していたが、複数の回転角度候補の尤度を確率的に補間することで、角度候補の中間にある角度も推定できるようにし、記憶容量を増加させることなく推定精度を高めることができた。 さらに、本手法を用いて、プレート検出処理を行うことなく、画像から直接文字検出・回転文字認識を行い、文字候補の組合せと車番テンプレートのマッチングを取ることで、様々な角度から撮影された画像に対する車番認識を実現し、国内シンポジウムと国際会議で発表した。 また、向上した回転角度推定精度を用いて、文字列が印字されている平面の法線ベクトルを推定する手法を提案し、国内研究会で発表した。これは、物体の表面に印字された文字から形状復元を行うShape from characterの実現に向けた第一歩である。一方、印刷漢字・かなを対象とした研究では、人工的に発生させた印刷漢字・かなの3次元回転角度推定精度が十分であることを確認し、一文字が複数の連結成分から構成されている撮影画像中のかな文字に対する3次元回転不変文字認識、回転角度推定も行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
平成29年度に実施予定であった撮影方向を選ばない複数車番認識、平成30年度に実施予定であった印字面の形状復元について先行実施し、上に述べたように研究成果を発表することができたため。
|
今後の研究の推進方策 |
印刷漢字・かなの3次元回転不変文字認識と回転角度推定では、漢字までの字種を対象として複数連結成分から構成される撮影画像中の文字切り出し・文字認識・回転角度推定の実現を目差す。車番認識では、現時点で一つの車番にしか対応していない認識手法を、複数の車番でも認識できるようにしたい。また、さらなる回転角度推定精度向上により、文字印字面の法線ベクトルを正確に求め、形状復元を実現したい。
|
次年度使用額が生じた理由 |
予定より旅費が削減できたため。
|
次年度使用額の使用計画 |
学会誌投稿料、国際会議発表旅費に利用する予定である。
|