研究概要 |
映像例示型検索は,クエリとして与えられたサンプル映像から,色,エッジ,動きといった特徴量に基づいて,クエリに適合するショットとしないショットを識別するための分類器を構築する機械学習問題とみなすことができる.本研究では,映像例示型検索システムに機械学習手法を応用する際の様々な問題点について探求することを目的としている.まず23年度は,本研究を円滑に進めるために,映像検索システムのプロトタイプを構築することが重要と考えて,「特徴量を用いた映像表現における暖昧・不確実性に対処するためのラフ集合理論」,「サンプル,反サンプル映像における不均衡問題のためのバギング」,「高次元特徴量に起因する過学習問題のためのランダムサブスペース」のテーマに取り組んだ.結果的に,ラフ集合理論,バギング,ランダムサブスペースはいずれも有効に機能し,世界的な映像検索コンテストとして有名なTRECVID 2009で開発された最先端の手法と比較して,上位1/4以内に入るという高性能な映像検索システムを構築することに成功した.さらに,「人」,「建物」,「車」といった映像中の物体認識の結果を導入して,クエリに適合しない大量のショットをフィルタリングする手法を開発した.これにより,検索性能を向上させるだけでなく,検索時間も大幅に短縮することにも成功した.最後に,本年度は,以上の内容に関して,学術論文2本(査読有),学会発表3件(査読有2件,無1件)という研究成果が得られた.24年度は,「サンプル映像と相反する反サンプル映像を収集するための部分教師つき学習」と「高次元特徴量に対する類似尺度」について検討する予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
23年度に計画していた研究内容(ラフ集合理論,バギング,ランダムサブスペース)は,完全に達成できた,さらに,24年度に計画している研究内容(部分教師つき学習,高次元特徴量に対する類似尺度)についても,既に予備検討を開始している.
|
今後の研究の推進方策 |
来年度は,部分教師つき学習,高次元特徴量に対する類似尺度など、機械学習で研究されてきた手法を映像検索に応用するテーマに取り組む予定である.現時点で,研究内容を変更しなければならないような大きな問題はない.なお,予備検討の結果から,高次元特徴量に対する類似尺度に関しては,高次元データに対して汎化性の高い分類器として知られるSupport Vector Machine(SVMが有効に機能することが分かってきている.そのため,SVMの出力値に基づいて映像間の類似度を計測すれば,サンプル映像に相反する反サンプル映像を適切に収集可能な部分教師つき学習手法を開発できると考えている.
|