2012 年度実績報告書

Ｗｅｂからの画像データ自動収集と機械学習を用いたオブジェクト識別システムの構築

研究課題

研究課題/領域番号	21700121
研究機関	筑波大学
研究代表者	手塚太郎筑波大学, 図書館情報メディア系, 准教授 (40423016)
研究期間 (年度)	2009-04-01 – 2013-03-31
キーワード	画像認識 / データベース / 情報検索 / 機械学習
研究概要	本研究では画像中に何が写っているかを自動判定する一般物体認識のため、画像における局所的な特徴量とその空間配置を語彙と対応づけるシステムを構築することを目的とした。画像と語彙の組を取得するため、World Wide Web上で公開されている画像データに着目した。これらの画像の多くはHTMLで記述されたWebページ中に埋め込まれており、周辺のテキストは画像に写されている対象（オブジェクト）と関連していることが多い。本研究ではこれらの周辺テキスト中の語彙と画像に写された対象（オブジェクト）に対して機械学習を適用し、画像・画像特徴量・語彙の相互変換システムを実装した。特には画像を単なる特徴量の集まりではなく、特定の意味を担う記号的構成要素(オブジェクト)の集まりであるとみなし、それぞれの構成要素がどのような意味的役割を果たしているかをトピックモデルに基づいて推定する手法の研究を進め,その有向性を検証した。画像データのソースとしてWeb検索を利用することにより、任意のカテゴリを対象とした画像認識システムを短時間／低コストで実現することが可能になる。また、このデータを用いて画像集合中からその単語において表されるもっとも典型的な画像の候補を求める手法を提案し、実験によって評価した。これらの結果について、2本の雑誌論文を発表した。
現在までの達成度 (区分)	理由 24年度が最終年度であるため、記入しない。
今後の研究の推進方策	24年度が最終年度であるため、記入しない。

研究成果
(2件)

すべて雑誌論文 (2件) (うち査読あり 1件)

[雑誌論文] Latent Semantic Filtering on Recognition Errors for Improving Audio Lifelog Search2012
- 著者名/発表者名
  Taro Tezuka
- 雑誌名
  
  Advances in Multimedia Technology
  
  巻: 1 ページ: 1-11
[雑誌論文] Multilingual Translation Support for Web Pages Using Structural and Semantic Analysis2012
- 著者名/発表者名
  Fuminori Kiumra
- 雑誌名
  
  IAENG International Journal of Computer Science
  
  巻: 39 ページ: 276-285
- 査読あり