2016 年度研究成果報告書

フォークソノミーによる大規模タグ付き映像集合を利用した動詞的概念の視覚モデル化

研究課題

研究課題/領域番号	26730090
研究種目	若手研究(B)
配分区分	基金
研究分野	知覚情報処理
研究機関	大阪大学
研究代表者	中村和晃大阪大学, 工学研究科, 助教 (10584047)
研究期間 (年度)	2014-04-01 – 2017-03-31
キーワード	視覚メディア処理 / 視覚概念学習 / 動作認識 / 映像処理 / 画像処理
研究成果の概要	YouTube等の映像共有サービスに投稿されるタグ付き映像を利用して動詞的概念（動詞により表される概念）の視覚モデルを構築する技術について検討した．一般に，映像に付与されているタグが映像中のどのシーン（区間）を表現したものであるかは自明ではない．そこで本研究では，同一のタグが付与された複数の映像群に共通して現れる区間（共通区間）を当該タグに対応する区間として抽出する手法，および抽出した区間を利用して当該タグが表す概念の視覚モデルを構築する手法を開発した．また，共通区間の抽出に際しては，区間同士の類似度を定める必要があるが，これをタグ付き画像の集合に基づいて定量化する手法も併せて開発した．
自由記述の分野	視覚メディア処理