研究概要 |
(1)静止画認識の大規模化・省メモリ化・高精度化:スカラー量子化によるメモリ削減,ならびに生成型学習の概念を導入することにより,処理精度を保ったまま,10倍の容量である100万物体が認識できるような方式を考案した.また,使用メモリを一定にして,より精度やロバスト性の高い認識手法へと改良した.さらに,カメラ付き携帯電話を用いて撮影したボケやプレを伴う画像に対しても有効な手法を開発した. (2)立体物認識:立体を撮影した複数の静止画を用いてモデルを構築し,認識する手法を考案した.本手法の特徴は,物体認識シミュレーションを用いた特徴量の取捨選択によりモデル構築に必要なメモリ量を低減する点にある. (3)ユーザインタフェースへの適用・動画中の物体をトラッキングするとによって物体による動画のインデクシングを可能とし,その技術をユーザインタフェースへと適用した. (4)著作権保護分野への応用:画像認識技術を用いて漫画などの線図形の著作権保護を行う手法を提案した.本手法の特徴は,手書きによる複製にも対処可能な点である. (5)局所特徴に基づく認識の理論的基盤の構築:平成19年度に構築した2項分布モデルを発展させ,投票処理に基づく物体認識のより精密な理論を構築した. (6)文書画像検索の高度化とその応用 既に提案しているLLAHと呼ぶ手法を拡張し,日本語など多言語に適用可能としたほか,モザイキングや書き込み抽出などに応用した.
|