本研究の目的は、情景中のあらゆる文字を実時間で認識し、利用者に必要な文字情報を自動的に抽出して利用者に提供するシステムの実現である。目指すシステムを実現するためには、(1)実時間文字・単語認識システムめ実装と、(2)単語照合による、利用者が必要な情報の抽出、(3)画面表示や音声による利用者への情報提示、というステップが必要となる。本年度は、(1)を実現した。すなわち、前年度まで受けていた科研費の成果を基に、ノートパソコンで動作する実時間単語認識システムを実装した。 以下、本年度の成果をより詳細に述べる。 本研究課題を開始する前に、射影変換を受けた文字の高速な認識方法を既に開発していた。本年度は、まずこの既存の方法を改良した。具体的には、従来手法は認識可能なフォント数を増加させると認識率が低下するという問題を解決した。 次に、この文字認識手法の出力を組み合わせることで単語認識を実現する手法を開発した。 そして、これらの技術を利用して、ノートパソコンで動作する新しいインタフェースを開発した。これは、利用者がカメラを向けた方向にある単語を認識し、その単語の翻訳と、単語にあらかじめ関連づけられた画像や音声を提示するものである。例えば、Hawkという単語を認識したときには、鷹の画像を表示しだり、鷹の鳴き声を再生したりするといった具合である。このインタフェースを用いれば、利用者はwebページのリンクをクリックするのと同様の手軽さで、知りたい情報を入手することができる。
|