2016 Fiscal Year Research-status Report
ソーシャルメディアからの構造的知識の抽出と投稿意図分析
Project/Area Number |
16K00423
|
Research Institution | Waseda University |
Principal Investigator |
岩井原 瑞穂 早稲田大学, 理工学術院(情報生産システム研究科・センター), 教授 (40253538)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | ソーシャルメディア / ユーザ行動分析 / 実体リンキング / テキストマイニング / 意味的関連性 / 時系列分析 / クラスタリング |
Outline of Annual Research Achievements |
WikipediaやFacebookに代表されるソーシャルメディアは,多数のユーザの投稿で成立するユーザ参加型メディアである.本年度は,ソーシャルメディアの先導的応用の観点から次の2つのテーマについて研究を行った. 時間経過を考慮した構造的知識の抽出では,編集履歴を有する記事集合から文や節などの単位で意味的な関係性を評価することにより,文脈的あるいは時間的に重要なフレーズを抽出する.時間的側面では,週や月といった単位でバースト的な編集が行われているフレーズを抽出する方法として,編集履歴からフレーズを選択する評価関数を定義した.これを記事集合の履歴に適用してバーストの検出がお行えることを示した.また,実体リンキングについては,Wikipediaのカテゴリ階層も反映した意味的関連性を定義して,リンキングの精度を上げることが可能なことを示した.さらに記事間のリンク先として,記事全体ではなく,より関連の深い節を求める応用にも適用した. ソーシャルメディアにおける投稿の意図分析では,ソーシャルメディアにおいてユーザが投稿を一般に公開する場合に,どのような意図に基づいているかをモデル化し,外部から観測可能な情報のみにより投稿意図を推定する統計モデルの構築を目的としている.本年度は,まずユーザプロファイルと公開投稿の収集を行った.投稿の意図を手動で分類し,階層的に集約することにより,公開投稿の意図分類モデルを構築した.投稿頻度やプロファイルで5つの意図分類のうちどれと相関性があるかを統計分析により求めた.また投稿の文章に対し,センチメント分析を適用して,正負の極性ならびに主観的か客観的かの2軸で分類を行った.ユーザ個人ごとのセンチメントの分布に対し,クラスタリングを行い典型的な類型に分類した.この類型と投稿意図やユーザの属する公開グループについて,相関性がいくつか存在することを示した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
各設定テーマについて,それぞれ手法の開発ならびに実装を行い,初期的な評価結果が得られており,今後さらに改良に取り組むことが可能であるため.
|
Strategy for Future Research Activity |
今後は,初年度に開発した手法について,さらに改良を進めるとともに,評価実験を進めてゆく.時間経過を考慮した構造的知識の抽出では,編集履歴としてバーストなどを生じているフレーズを抽出する評価関数について,多様な記事集合に適用することにより品質の向上を行う.また,多量の記事の処理を可能とするために,手法の高速化についても進める.フレーズの時系列について,類似したバーストの履歴を持つフレーズ群を求めるために,時系列クラスタリングを行う.その際,dynamic time warpingを基礎として,編集履歴の特徴性をよく捉えられ,ノイズに頑健な類似性の距離関数を定義する.多数の記事集合に時系列クラスタリングを適用することにより,時間的関連性の大きなフレーズ群を求めることができるか評価実験を行う. 実体リンキングについては,カテゴリ階層を導入した意味的関連性評価手法についてさらに改良を行い,ベンチマークテストにより評価実験を行う.また,リンク先の節を求める問題についても,有用な素性ならびに意味的関連性評価手法を開発する.さらに応用例として,記事集合をまとめるテーブルのスキーマを自動的に発見する手法に,開発した手法を応用することを検討する. ソーシャルメディアにおける投稿の意図分析では,センチメント分析から求めた,ユーザの投稿類型や,その他列挙したユーザプロファイル属性について,ユーザの公開投稿の意図分類モデルとの統計的関連性について求める.さらにユーザの属する公開グループとの関連性も調査し,これらを元に,公開投稿の意図を予測するモデルや,公開グループに属するユーザを類型化し特徴づける応用について研究を行う予定である.
|
Research Products
(5 results)
-
-
[Presentation] `A Collective Approach to Ranking Entities for Mentions2016
Author(s)
Shunlin Rong and Mizuho Iwaihara
Organizer
15th IEEE/ACIS Int. Conf. Computer and Information Science(ICIS 2016), Special Session on Advanced Information Management for Affective and Human-centered Information System
Place of Presentation
岡山
Year and Date
2016-06-26 – 2016-06-29
Int'l Joint Research
-
-
-