2014 Fiscal Year Annual Research Report
マルチメディアデータを情報源とした時系列概念ネットワークの構築とその応用
Project/Area Number |
13J01688
|
Research Institution | National Institute of Informatics |
Principal Investigator |
桂井 麻里衣 国立情報学研究所, 情報学プリンシプル研究系, 特別研究員(DC2)
|
Project Period (FY) |
2013-04-01 – 2015-03-31
|
Keywords | Web画像 / マルチメディア / マルチメディアマイニング / 可視化 / 概念間関連度 / マルチモーダル / ソーシャルメディア |
Outline of Annual Research Achievements |
スマートフォンの普及やソーシャルメディアの発達により,ウェブ上のマルチメディアデータは人々の生活や社会の状況をリアルタイムに反映した貴重な情報源と化している.この情報源から概念間の関係性を獲得し,時間軸上での変化を検出することで,トレンドなどの知識抽出が可能となる.本年度は,マルチメディアデータから構築した時系列概念ネットワークに対し,ユーザの感情情報を導入するために,新たに画像の感情極性分類手法を提案した.具体的には,感情極性スコアをもつSentiWordNetという辞書を利用し,画像のテキスト特徴からポジティブスコアを算出した.特に,感性を表す概念間の関連度を利用してタグの欠落を補うアプローチを導入した.実際に写真共有サイトFlickrから感情を表す単語がタグ付けされた画像を収集し,性能評価を行った結果,提案手法はベースライン手法を上回る分類精度を示した.画像の感情極性分類タスクについては,正解ラベルを含むデータセットが公開されていない.そこで,本年度の最後には,クラウドソーシングを通じた大規模なユーザ評価実験を行った.この実験では,ユーザに対し画像を提示し,画像のポジティブさ・ネガティブさの五段階評価を要請した.構築されたデータセットにより,提案手法の定量的な性能評価が可能になった. 本研究課題で提案した手法の応用可能性を示すために,学術論文データベースにおける研究者ネットワークの構築に適用した.具体的には,学術論文のアブストラクトから得られるテキスト特徴を次元削減するために,潜在変数を導入し,学術論文と潜在変数,潜在変数と単語の関係をモデル化した.モデルによって推定された潜在空間において,対象とする研究者の出版論文集合のセントロイドを算出した.また同姓同名研究者が存在する学術論文集合において,研究者のトピック情報を利用することで,著者同定が可能となることを示した
|
Research Progress Status |
26年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
26年度が最終年度であるため、記入しない。
|
Research Products
(3 results)