Research Abstract |
本研究では,認識対象ごとに大規模化・高速化・高精度化・省メモリ化を行っていくことを基本としている.本年度は,以下の成果を得た. (1)DB構築【黄瀬・内海】文書画像,顔画像に関して,インターネットからダウンロードすることによってデータを取得した.文書画像は5000万ページ,顔画像は100万画像である. (2)索引付け・検索【黄瀬】大規模なデータを索引付けし,検索・認識処理を行う.文書画像については特徴点の取捨選択,顔画像については局所特徴量の利用とプロダグト量子化,3次元物体についてはBloomerフィルタの利用,局所特徴量の大規模部分空間により,効率的で高精度な索引付けを実現した. (3)認識の高精度化【黄瀬・内海】顔画像認識に従来から使われていたガボール特徴を見直し,物体認識と同様の局所特徴量を用いることによって,精度を落とさずに高速な照合が可能となった.文書画像検索については平面物体認識に用いていた摂動処理を導入して精度を向上させた.3次元物体認識については,Bloomerフィルタの効果を確認したほか,2段階相互部分空間法によって高精度な認識を実現した.また,文字認識については,自由書式,複雑背景という困難な条件での高速認識を実現した. (4)近似最近傍探索【岩村】近似最近傍探索の新しい手法として,ハッシュを用いた距離の概算値に基づく段階的照合法を開発した.これによって,従来から用いていたハッシュ法と比べて数倍の高速化を実現できた. (5)文書画像検索を用いたサービスの構築【黄瀬】大規模文書画像検索が可能になったことから,これを用いた次のサービスを種々考案し,実現した.(a)スマートフォンを用いた文書画像検索と拡張現実,(b)アイトラッカと接続することによるリーディング・ライフ・ログ,(c)モバイルプロジェクタとの連携による実文書への拡張現実である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平面物体認識用のデータベースについては拡張を行わなかったものの,文書画像検索については当初目標としていた1億ページの半分を達成,顔画像については当初目標通りの100万画像を達成した.認識精度や速度の向上については,文書画像検索,顔画像検索で著しい成果を得たほか,3次元物体認識においては局所特徴量の相互部分空間法によって第1回Asian Conference on Pattern Recognitionの最優秀論文賞を受賞した.近似最近傍探索の研究では,既存の最新手法と比較しても十分高速な手法を確立できたとともに,文書画像検索を用いた種々のサービスを新たに実現した.以上より,おおむね順調と判断した.
|
Strategy for Future Research Activity |
データベースの大規模化を推進する.文書画像については1億,顔画像については1千万の画像を目標とする.次に認識のロバスト性実現にも注力する.具体的には複雑背景下での3次元物体認識,文書画像検索,文字認識などを実時間処理として実現するための研究を行う.さらに,文書画像検索を用いたサービスをより実利用に近づける開発を行うほか,手法の中核を担う近似最近傍探索の改良,理論構築をあわせて行なっていく.
|