研究概要 |
昨年度は,研究代表者らが既に提案していた射影変換に頑健な高速文字認識手法に高速化・高精度化・多種フォント対応を行い,それを用いた情報提示システム提案した.この成果を今年度(2010年6月)国際ワークショップDAS 2010で成果発表したところ,IAPR Nakano Award(最優秀論文賞)を受賞した. 本年度は,昨年度に引き続いて実時間単語認識システムの性能向上を行うと共に情景中からの文字抽出を試みた. (1)情景中のあらゆる文字を抽出するためには,利用者にカメラを持ってもらい,実時間で認識する必要がある.そのために利用するカメラとしては,全方位カメラを想定していたが,たまたま利用可能であったアイトラッカー付属カメラで情景中の文字を認識することを試みた.その結果,実時間で動作するシステムを開発することができた.しかし,ピントが合っていない認識対象に対しての文字認識は容易ではなく,自動ピント合わせ装置付きのカメラを使用するか,ぼけに頑健な認識手法が必要ということがわかった.そこで,下記(2)と(3)を並行して行った. (2)昨年度開発したシステムは文字切り出しが成功したときには高速かつ高精度に文字認識が可能であるが,そうでなければ効果を発揮しないものであった.そこで,局所特徴量を利用した文字認識手法を試みた.その結果,昨年度のシステムが英数字だけを対象としていたのに対して,この手法は漢字混じりの日本語も認識することができ,従来システムを補完するものであることがわかった. (2)文字を相当斜めから撮影すると,文字が潰れてしまい,文字認識がかなり困難になる.そこで,文字認識で失われた情報を単語辞書を利用して補完するために昨年度開発したシステムにスペルチェッカーを組み込んだ.これにより,単語によっては大幅に認識率が向上した.
|