• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2011 年度 実施状況報告書

Webマルチメディアマイニングによる動詞概念と名詞概念およびその関係の自動学習

研究課題

研究課題/領域番号 23650044
研究機関電気通信大学

研究代表者

柳井 啓司  電気通信大学, 情報理工学(系)研究科, 准教授 (20301179)

研究期間 (年度) 2011-04-28 – 2014-03-31
キーワード動作認識 / Web動画 / 一般物体認識
研究概要

本年度は,動詞と名詞を組み合わせたキーワードに対応する動画ショットをWeb上の動画共有サイトYoutube上のWeb動画から自動抽出する技術を開発し,100種類以上のキーワードに関して実際に動画ショット自動収集実験を実施した. 具体的には,"eat+ramen"や"walk+street"などの動詞と名詞を組み合わせたキーワードを用いてYoutube APIを利用してYoutubeに対してテキスト検索を行う.検索結果の上位1000本の動画についてタグの共起性を分析し,再ランキングを行う.そして,上位200本の動画を実際にダウンロードして,動画をショット分割し,それぞれのショットから時空間特徴量を抽出する.さらに,抽出した時空間特徴量を利用してショット同士の類似性を評価して類似度行列を計算し,教師データが不要なPageRank手法を適用して最終的に検索単語に対応するショットのランキングを得る.これは「検索単語に対応するショットは互いに類似していて上位に200本のWeb動画には共通に含まれ,一方,対応しないショットは互いに異なる」という仮定に基づいている.最終的には100種類の動詞名詞の組み合わせについて実験を行い,教師データなしで50%程度の精度を実現した.この成果は画像認識におけるトップカンファレンスの国際会議において発表した. こうした,教師データなしで,Webから指定キーワードの対応ショットを自動収集する研究は従来ないものであったが,精度は50%程度であり,そのまま動詞・名詞の関係分析に利用可能であるほどには精度が高くないため,その改良手法としてWeb上の静止画像も組み合わせて利用する手法を研究中で,さらなる精度向上を目指している.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

23年度の当初の研究計画は「主に, 動作と動作主体・動作対象の動詞概念, 名詞概念の組み合わせに対応する動画ショットを大量のタグ付きWeb動画から自動抽出する手法について研究する.また,効率的なWeb動画収集法についても検討する.」であったが,実際に,動詞と名詞を組み合わせたキーワードに対応する動画ショットをWeb上の動画共有サイトからダウンロードして自動抽出する技術を開発し,100種類以上のキーワードに関して実際に動画ショット自動収集実験を実施し,国際会議において成果を発表した.さらに,その改良手法としてWeb上の静止画像も組み合わせて利用する手法を研究中で,さらなる精度向上を目指している.

今後の研究の推進方策

今後は,23年度の研究成果を利用して,大規模に動詞概念と名詞概念に関係する動画ショットを大量にWeb動画から収集し,動詞概念と名詞概念の関係について時空間特徴量とエントロピー分析を用いて分析を行う.なお,得られたデータにノイズが多い場合は,自動処理にこだわらずにAmazon Mechanical Turk等のcrowd-sourcingを積極的に利用して分析に耐えうる精度のデータセットを構築する予定である.今年度は「ラーメンを食べる」と「カレーを食べる」のような動作の微小な差異を検出するための方法も研究する予定である.最終的には「ラーメンを食べる」と「うどんを食べる」は共通した動作であるが,「カレーを食べる」は異なるという,同じ動作でも対象によって動作が異なる動詞・名詞の組み合わせを自動発見することを最終目的とする.

次年度の研究費の使用計画

すでに必要な機材は準備済であるので,24年度の研究費は主に成果発表のための国際会議参加費等に利用する予定である.また,データクリーニングのために,Amazon Mechanical Turk等のcrowd-sourcingの利用費用にも支出する予定である.

  • 研究成果

    (4件)

すべて 2012 2011

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (2件) 図書 (1件)

  • [雑誌論文] Folksonomyを用いた画像特徴とタグ共起に基づく画像オントロジーの自動構築2011

    • 著者名/発表者名
      秋間雄太,川久保秀敏,柳井啓司
    • 雑誌名

      電子情報通信学会論文誌D

      巻: J94-D-8 ページ: 1248-1259

    • 査読あり
  • [学会発表] A Travel Planning System Based on Travel Trajectories Extracted from a Large Number of Geotagged Photos on the Web2011

    • 著者名/発表者名
      Kohya Okuyama and Keiji Yanai
    • 学会等名
      Pacific-Rim Conference on Multimedia
    • 発表場所
      Sydney, Australia
    • 年月日
      2011 – 12
  • [学会発表] Automatic Construction of an Action Video Shot Database using Web Videos2011

    • 著者名/発表者名
      Do Hang Nga and Keiji Yanai
    • 学会等名
      IEEE International Conference on Computer Vision (ICCV)(招待講演)
    • 発表場所
      Barcelona, Spain
    • 年月日
      2011 – 11
  • [図書] Multimedia Information Extraction2012

    • 著者名/発表者名
      Mark T. Maybury (Editor)
    • 総ページ数
      496
    • 出版者
      Wiley-IEEE Computer Society Press

URL: 

公開日: 2013-07-10  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi