2019 年度実施状況報告書

ソーシャルメディアの時間的・意味的分析を活用した知識グラフの構造的拡張

研究課題

研究課題/領域番号	19K11983
研究機関	早稲田大学
研究代表者	岩井原瑞穂早稲田大学, 理工学術院(情報生産システム研究科・センター), 教授 (40253538)
研究期間 (年度)	2019-04-01 – 2022-03-31
キーワード	テキストマイニング / 情報抽出 / ソーシャルメディア / 知識処理 / 時系列分析 / センチメント分析
研究実績の概要	代表的な知識蓄積型ソーシャルメディアであるWikipediaからは，計算機利用が容易な構造的データが知識グラフとして抽出され，検索結果の分類や種々の自然言語処理に活用されている．知識グラフを充実させるためには，Wikipedia記事のマイニングにおいて，リンクやリスト，カテゴリなどの構造情報を活用し，さらに拡張する新たな手法が必要である．本課題では，(1)知識グラフの構造的拡張において， (1-a) 記事間のリンク予測および記事の分離統合予測問題, (1-b) Wikipediaリストの要素帰属問題およびテーブルスキーマ生成問題, (1-c) 実体リンキングへの応用からなる新たな課題に取り組む．また記事の時系列変化に着目した，(2) 編集履歴からの特徴的語句の抽出に取り組む． (3)ソーシャルメディアにおけるセンチメントの集約表現では，ツイートなどのソーシャルメディアにおける関心やムードの簡潔な集約表現を開発し，Wikipediaの成長過程との対比を可能にすることを目指す．本年度は，(1-a)の分離統合予測問題について，長大な記事における，節単位の類似度の分布から得られる特徴量，および記事のトピックに適応させた単語埋め込みを用いて，弁別器を訓練することにより，標準的な手法よりも精度良く予測できることを示した．(1-b)(1-c)に関して，知識グラフにおける枝の補完問題について，実体の属するクラス集合を新たに利用することにより，精度を向上できることを示した．(2)に関して，編集履歴においてバースト的に編集されている語句の間で，バーストの時系列の類似性を求めることにより，語句間の時間的類似度を求める方法を示した．(3)では，ツィートにおけるユーザごとのセンチメントの分布傾向を求め，これをツィートの著者推定に応用する手法を示した．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由計画段階でのテーマ設定に基づき，個々の成果を上げている．
今後の研究の推進方策	初年度に着手した各テーマをさらに発展させ，新たな手法を試みるとともに，応用課題にも取り組む．

研究成果

(4件)

すべて 2020 2019

すべて雑誌論文 (1件) (うち査読あり 1件、オープンアクセス 1件) 学会発表 (3件) (うち国際学会 3件)

[雑誌論文] Detection of Mergeable Wikipedia Articles Utilizing Multiple Similarity Measures2020
- 著者名/発表者名
  Renzhi Wang, Mizuho Iwaihara
- 雑誌名
  
  Journal of Information Processing
  
  巻: 28 ページ: 178-191
- DOI
  https://doi.org/10.2197/ipsjjip.28.178
- 査読あり / オープンアクセス
[学会発表] Weakly-Supervised Neural Categorization of Wikipedia Articles2019
- 著者名/発表者名
  Xingyu Chen, Mizuho Iwaihara
- 学会等名
  Proc. ICADL2019, LNCS11853, pp. 16-22, Nov. 2019.
- 国際学会
[学会発表] Two-Encoder Pointer-Generator Network for Summarizing Segments of Long Articles2019
- 著者名/発表者名
  Junhao Li and Mizuho Iwaihara
- 学会等名
  The Asia Pacific Web (APWeb) and Web-Age Information Management (WAIM) Joint Conf. Web and Big Data (APWeb-WAIM 2019), LNCS 11641, pp. 299-313, Chengdu
- 国際学会
[学会発表] Utilizing Latent Posting Style for Authorship Attribution on Short Texts2019
- 著者名/発表者名
  Patamawadee Leepaisomboon, Mizuho Iwaihara
- 学会等名
  Proc. IEEE Int. Conf. Cloud and Big Data Computing (CBDCom 2019), pp.1015-1022, Fukuoka
- 国際学会

2019 年度 実施状況報告書

ソーシャルメディアの時間的・意味的分析を活用した知識グラフの構造的拡張

研究代表者

岩井原 瑞穂 早稲田大学, 理工学術院(情報生産システム研究科・センター), 教授 (40253538)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Detection of Mergeable Wikipedia Articles Utilizing Multiple Similarity Measures2020

著者名/発表者名

雑誌名

DOI

[学会発表] Weakly-Supervised Neural Categorization of Wikipedia Articles2019

著者名/発表者名

学会等名

[学会発表] Two-Encoder Pointer-Generator Network for Summarizing Segments of Long Articles2019

著者名/発表者名

学会等名

[学会発表] Utilizing Latent Posting Style for Authorship Attribution on Short Texts2019

著者名/発表者名

学会等名

2019 年度実施状況報告書

岩井原瑞穂早稲田大学, 理工学術院(情報生産システム研究科・センター), 教授 (40253538)