2010 Fiscal Year Annual Research Report
文字認識技術を用いた実環境内の文字情報提供システムの開発
Project/Area Number |
20500501
|
Research Institution | Sasebo National College of Technology |
Principal Investigator |
志久 修 佐世保工業高等専門学校, 電子制御工学科, 准教授 (00235516)
|
Keywords | 文字認識 / 文字情報提供 |
Research Abstract |
本研究では、全方向カメラ(周囲360度のパノラマ画像を撮影可能)、ステレオカメラ(対象物までの距離を画素値とする距離画像を取得)、および通常のカメラの3種類のカメラによる画像撮影システムを用いた文字情報提供システムの開発を目指している。 当該年度では、通常のカメラで、厚い本を開いたような曲面に書かれている文字列を、斜めから撮影した場合の抽出・認識技術について主に取り組んだ。曲面に書かれた文字列を斜めから撮影すると文字列に湾曲ひずみおよび傾斜ひずみが生じる。このような湾曲した文字列でも局所領域に注目すると、文字が直線状に並んでいると近似できる。そこで、注目文字を含む文字列の一部分(部分文字列)に外接する平行四辺形を求める。そしてこの平行四辺形から得られる文字列高さ,文字列方向,文字の傾斜をもとに、注目している文字の大きさ、回転、傾斜を補正する。この補正した注目文字に対し、文字認識を適用する。 この処理を、注目文字を変え繰り返し行っていくことで、画像内の全部の文字を認識する。このとき文字認識の前処理として、前年度開発した文字単体の正規化を行うことで、さらなる形状補正を行う。提案法を評価するため、厚い本を斜めから撮影した画像から手動切り取った文字列画像587枚(7,276文字)と全方位カメラで撮影したパノラマ画像から手動で切取った文字列画像14枚(112文字)に対して実験を行った。 実験の結果、補正をしない場合は全く認識できなかった文字列を、文字列補正の適用により76%程度の精度で認識できるようになった。さらに、文字列補正と文字補正を組み合わせることで、認識率がさらに向上した。
|