2008 Fiscal Year Annual Research Report
文字認識技術を用いた実環境内の文字情報提供システムの開発
Project/Area Number |
20500501
|
Research Institution | Sasebo National College of Technology |
Principal Investigator |
志久 修 Sasebo National College of Technology, 電子制御工学科, 准教授 (00235516)
|
Keywords | 文字認識 / 文字情報提供 |
Research Abstract |
本研究では、全方向カメラ(周囲360度のパノラマ画像を撮影可能)、ステレオカメラ(対象物までの距離を画素値とする距離画像を取得)、および通常のカメラの3種類のカメラによる画像撮影システムを用いた文字情報提供システムの開発を目指している。 当該年度では、全方位カメラで撮影したパノラマ画像からの特定マークの高速探索法、ステレオカメラを用いた3次元情報抽出、通常のカメラを用いた斜めから見た文字列の認識技術についての研究を実施した。これらは、風景の中の文字列を読み取るために、あらかじめ読み取り対象の文字列の近傍に「特定マーク」を付加しておくことを想定する。すなわち、パノラマ画像から特定マークを検出することで文字列の大まかな位置を求め、雲台に乗せたステレオカメラと通常のカメラを文字列位置に向け、文字列を撮影・認識する。 特に通常のカメラで斜めから撮影した文字列を認識する技術は、携帯電話やデジカメによる街角の看板文字列の認識にも応用できるため、非常に重要な技術である。斜めから見た文字列には射影ひずみが生じている。本研究では、射影ひずみを受けている文字列を、正面から見たように補正する方法を開発した。この方法では、文字列の水平方向と垂直方向の消失点をそれぞれ求め、これらの2点をそれぞれ通過する2対の直線による囲まれた四辺形を、長方形に変換することで補正を行っている。開発した補正方法の性能を1,250枚の文字列画像(5,660文字)に対する認識実験により評価した。実験の結果、補正無しでは文字認識率が73.6%であったのに対し、補正を行うことにより89.8%まで向上した。
|