WikipediaやFacebookに代表されるソーシャルメディアは,多数のユーザの投稿で成立するユーザ参加型メディアである.本年度は,ソーシャルメディアの先導的応用の観点から次の2つのテーマについて研究を行った.(1)時間経過を考慮した構造的知識の抽出では,編集履歴を有する記事集合から,バースト的に編集が行われた文やフレーズを抽出する.1つのカテゴリなど数百からなる比較的大きな記事集合に対し,バースト的編集が行われた時期を抽出し,そのバーストに関連を持つ語句を,記事の編集履歴から抽出する方法を開発した.時間的変化を考慮したTFIDFスコアをノードの重みとし,編集差分での共起関係を枝の重みとするグラフから,TextRankにより重要語句を抽出する手法を開発した.これにより,バーストによく関連した語句が抽出され,記事の発展とともに重要語句が変遷することを確認した.またGoogle Trendとの比較により,サーチエンジンでの関心の変化と,Wikipediaでの編集活動の度合いを同一語句で比較することにより,バースト的な編集と継続的な編集がそれぞれ観測できることを示した.実体リンキングについては,実体抽出を行うタスクと,知識ベースの実体にリンクするタスクを統一的に深層学習する手法を開発し,個別に学習するよりも精度が向上することを示した.(2)ソーシャルメディアにおける投稿の意図分析では,ツイートにセンチメント分析を適用して,正負の極性ならびに主観的か客観的か,および文の長さ等の多次元ベクトルを生成した.これにLDAを適用して,ユーザごとのセンチメントの分布が7つの潜在的な投稿タイプに分類することが分かった.求めた投稿タイプを用いて,ユーザの投稿スタイルの類似度判定を行うことができ,語彙分布と組み合わせることにより,ツイートの筆者特定の精度を向上できることが分かった.
|