研究概要 |
コンピュータから向き及び倍率を制御することが可能なビデオカメラを用い、周囲にある文字情報を能動的に取得する方法を開発することを目的とし、ビデオ映像中の文字情報が存在する領域の検出法、および文字画像の高精度認識法について検討し、様々な成果が得られた。また、このような情景画像中文字の抽出法や認識法と並行して、映像中の物体認識法についても検討を行なった。 本研究の主な成果は以下の通りである。 1.情景画像中文字認識 ビデオカメラで撮影したカラー情景画像を想定した場合、解像度の低さ、文字列上の陰影の存在、画像全体の輝度の低さ,文字の相対的な小ささ等、様々な要因により文字列が存在する領域(文字領域)の抽出が困難となる。高精度な文字領域抽出のために、カラー情報と明度情報の双方を用いることで上述のような困難さを含む様々な情景画像から高精度に文字領域を抽出するアルゴリズムを提案した。また、既存の手法では対応が難しい孤立文字の切り出しと認識を可能とするために、特徴の検索と投票に基づく、文字の切り出しと認識を同時に行う手法を検討した。 2.映像中の物体認識法 映像中の物体を高速に認識するための手法を検討した。物体の特徴の中でも,色ヒストグラムは形状に関する特徴と比較して検出時の物体の3次元的な変化やオクルージョンに頑健であると報告されている。そこで,色ヒストグラムを特徴として用い、色ヒストグラムを効率よく構築することによって探索を高速化する手法を検討した。また、物体の構造の変化に柔軟に対応するため、シルエット図形を対象とし、図形を階層的なパーツに分解し、グラフマッチングを利用して識別する手法について検討した。また、新しい試みとして、テンプレートを関数で表し、様々な大きさ・縦横比のテンプレートと入力画像とのマッチングを高速に行う手法についても検討を行った。
|