2012 Fiscal Year Annual Research Report
Project/Area Number |
23300038
|
Research Institution | Kobe University |
Principal Investigator |
上原 邦昭 神戸大学, その他の研究科, 教授 (60160206)
|
Co-Investigator(Kenkyū-buntansha) |
白浜 公章 室蘭工業大学, 工学(系)研究科(研究院), 助教 (30467675)
|
Project Period (FY) |
2011-04-01 – 2014-03-31
|
Keywords | 映像検索 / 機械学習 / 部分教師つき学習 / ラフ集合理論 / バギング / ランダムサブスペース / MapReduce / TRECVID |
Research Abstract |
映像例示型検索は,クエリとして与えられたサンプル映像から,色,エッジ,動きなどの特徴量に基づいて,クエリに適合するショットとしないショットを識別するための機械学習問題とみなすことができる.本研究では,映像例示型検索に機械学習手法を応用する際の様々な問題点について探求することを目的としている. 本年度は,サンプル映像だけからでは高精度な分類器を構築できないという問題に対して,「サンプル映像と相反する反サンプル映像を収集する部分教師つき学習手法」を開発した.これは,サンプル映像をクエリに適合した映像の見本,反サンプル映像を適合しない映像の見本とすれば,両者を識別するための分類境界を明確に定義できるという考え方に基づいている.具体的には,分類境界を定義するために有用な反サンプル映像を「サンプル映像に類似しているが,クエリに適合しない映像」と考えて,2段階フィルタリングにより,データベースから反サンプル映像を収集する手法を開発した.1段階目のフィルタリングでは,特徴量に関して,サンプル映像と類似していない映像を排除する.2段階目のフィルタリングでは,物体認識技術を用いて,サンプル映像と類似した物体が認識されている映像はクエリに適合する可能性が高いとして排除する.最終的に,本手法により有用な反サンプル映像を適切に選別できること,さらに前年度開発した映像検索手法に導入して,検索精度の向上のみでなく,検索時間も短縮できることを示した. また物体認識技術に関しては,米国国立標準技術研究所主催の2012年度国際競争型映像検索・評価ワークショップ (TRECVID) の意味インデクシング部門で,世界25機関で開発された全91手法のうち,第1位の物体認識精度を達成することに成功した.さらに,学術論文2本(査読有),学会発表5件(査読有2件,無3件,受賞1件)という研究成果を得た.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
23年度と24年度に予定していた研究テーマ(ラフ集合理論,バギング,ランダムサブスペース,部分教師つき学習,高次元特徴量に対する類似尺度)は,完全に達成できている.また,部分教師つき学習の基盤となっている物体認識に関して,著名な国際競争型ワークショップ (TRECVID 2012) にて,世界最高精度を達成することに成功している.
|
Strategy for Future Research Activity |
当初の計画通り,25年度は「大規模データに対するスケーラビリティ」を向上させるために,MapReduceなどの並列プログラミングモデルを用いて,これまでに開発した映像検索手法を高速化する.そして,合計838本の映像(約240GB)からなる大規模データを用いて,開発した手法の検索精度,及び検索時間を検証する.数値目標としては,上記の約30秒以内に,平均精度約0.15 で検索することを目標とする.
|
Research Products
(10 results)