研究課題/領域番号 |
16K00236
|
研究機関 | 三重大学 |
研究代表者 |
若林 哲史 三重大学, 工学研究科, 教授 (30240443)
|
研究分担者 |
大山 航 三重大学, 工学研究科, 助教 (10324550)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 文字認識 / カメラベース / 3次元回転 / 回転角度推定 / 車番認識 / グラフマッチング / 言語推定 |
研究実績の概要 |
我々は、カメラベースの文字認識において、回転や透視投影により変形した文字の認識を可能とする3次元回転不変文字認識手法を提案している。前年度までに、特徴ベクトルの低次元化と回転角度候補の確率的補間により、記憶容量を増加させることなく文字印字面回転角度の推定精度を高めるとともに、文字候補の組み合わせと車番テンプレートのマッチングを取ることで、様々な角度から撮影された車番認識を実現した。 平成29年度は、3次元回転により変形した文字から推定される2通りの回転角度のうち、正しい方を推定する手法を開発し、回転角度推定をさらに高精度化した。また、漢字のように複数の連結成分から構成される文字で構成される文字列の撮影画像から、組み合わせ最適化により、文字切り出し、認識、回転角度推定を行う手法について検討するとともに、複雑な背景中のドット文字の抽出、製造メーカーロゴの切り出しと認識についても研究を行い、後者については電子情報通信学会英文誌に発表した。 さらに、文字の切り出しと認識を行わずに文字列の言語推定を行う手法について検討した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成29年度までに実施予定であった、記憶量の削減と高速化、確率的補間による回転角度推定の高精度化、撮影方向を選ばない車番認識については、良好な結果が得られ、外部発表を行っている。また、印刷漢字・かなの3次元回転不変文字認識と回転角度推定についても、予備実験により良好な結果が得られており、大規模なデータによる性能検証と外部発表を行う段階に来ているため。
|
今後の研究の推進方策 |
1. カメラで撮影された画像中の日本語未字列認識システムを開発し、実際にカメラで撮影された日本語の看板や道路案内標識の画像を使ってその有効性を検証する。 2. 学会発表を行う。
|
次年度使用額が生じた理由 |
国内開催の国際会議で発表したため、旅費が少なくて済みました。 次年度論文投稿費用で利用予定です。
|