2017 年度実績報告書

分散表現と構成的意味計算に基づくテキストと知識ベースの頑健なグランディング

研究課題

研究課題/領域番号	15H05318
研究機関	東京工業大学
研究代表者	岡崎直観東京工業大学, 情報理工学院, 教授 (50601118)
研究期間 (年度)	2015-04-01 – 2018-03-31
キーワード	自然言語処理 / 知識獲得 / 意味解析 / 表現学習 / 分散表現 / 深層学習 / 意見分析 / 質問応答
研究実績の概要	計算機による自然言語の理解・推論を実現するため、テキストを知識に対応付ける（グランディングする）手法、及びその実タスクへの応用に関する研究を進めた。昨年度までの研究成果を活用するため、知識源としてWikipediaを主に採用した。実タスクとしては、質問応答と賛否分析に取り組んだ。質問応答では、与えられた質問文に対して、その回答の候補を含むWikipedia記事を対応付け、Wikipedia記事の読解により答えを出力するアプローチに取り組んだ。早押しクイズの約12,000件の質問に対し、約46,000件のWikipedia記事との対応を明らかにしたデータセットを作成した。このデータセットを用いることで、質問の答えがWikipediaに見当たらない場合、という新しい問題設定を提起し、その状況を考慮することの効果を検証した。昨年度までに、Wikipediaの記事の中で言及される促進・抑制などの因果関係の認識に取り組んだ。この因果関係知識を活用した賛否分析という実タスクに取り組むため、14,000件のソーシャルメディアの投稿を収集し、大阪都構想やプレミアムフライデーなどの7話題に対する賛否を付与したデータを構築した。このデータを分析し、テキストと因果関係知識の対応付けの必要性を調査したところ、約1/3の投稿において対応付けが必要であることが分かり、本研究の重要性が示された。ソーシャルメディアのテキストから賛否を分類するため、昨年度までに「〇〇というトピックに賛成する人は××というトピックにも賛成する」という形の知識を抽出する手法を提案した（今年度に自然言語処理分野の最難関国際会議であるACLで発表）。この研究を拡張し、ユーザの日々の投稿と獲得した知識を対応付ける手法を考案した。その実験結果より、テキストと知識を対応付けることで意見分析の精度が向上することを実証した。
現在までの達成度 (段落)	29年度が最終年度であるため、記入しない。
今後の研究の推進方策	29年度が最終年度であるため、記入しない。

研究成果
(17件)

すべて 2018 2017 その他

すべて雑誌論文 (3件) (うち査読あり 3件、オープンアクセス 3件) 学会発表 (12件) (うち国際学会 3件、招待講演 5件) 備考 (2件)

[雑誌論文] A Joint Neural Model for Fine-Grained Named Entity Classification of Wikipedia Articles2018
- 著者名/発表者名
  Masatoshi Suzuki, Koji Matsuda, Satoshi Sekine, Naoaki Okazaki, Kentaro Inui
- 雑誌名
  
  IEICE Transactions on Information and Systems, Special Section on Semantic Web and Linked Data
  
  巻: E101.D(1) ページ: 73-81
- DOI
  10.1587/transinf.2017SWP0005
- 査読あり / オープンアクセス
[雑誌論文] 関係パタンの分散表現の計算2017
- 著者名/発表者名
  高瀬翔, 岡崎直観, 乾健太郎
- 雑誌名
  
  人工知能学会論文誌
  
  巻: 32(4) ページ: D-G96_1-11
- DOI
  10.1527/tjsai.D-G96
- 査読あり / オープンアクセス
[雑誌論文] Supervised Approaches for Japanese Wikification2017
- 著者名/発表者名
  Shuangshuang Zhou, Naoaki Okazaki, Koji Matsuda, Ran Tian, Kentaro Inui
- 雑誌名
  
  Journal of Information Processing
  
  巻: 25 ページ: 341-350
- DOI
  10.2197/ipsjjip.25.341
- 査読あり / オープンアクセス
[学会発表] Generating Text with Deep Neural Networks2018
- 著者名/発表者名
  Naoaki Okazaki
- 学会等名
  Deep Learning: Theory, Algorithms, and Applications, RIKEN Center for Advanced Intelligence Project (RIKEN-AIP)
- 招待講演
[学会発表] エンコーダ・デコーダモデルによるテキスト生成2018
- 著者名/発表者名
  岡崎直観
- 学会等名
  第211回情報処理学会コンピュータビジョンとイメージメディア（ＣＶＩＭ）研究会
- 招待講演
[学会発表] 自然言語処理における深層学習の進展2018
- 著者名/発表者名
  岡崎直観
- 学会等名
  豊橋技術科学大学先端データサイエンス講演会
- 招待講演
[学会発表] 読解による解答可能性を付与した質問応答データセットの構築2018
- 著者名/発表者名
  鈴木正敏, 松田耕史, 岡崎直観, 乾健太郎
- 学会等名
  言語処理学会第24回年次大会 (NLP2018)
[学会発表] ニューラルネットを用いた多方言の翻訳と類型分析2018
- 著者名/発表者名
  阿部香央莉, 松林優一郎, 岡崎直観, 乾健太郎
- 学会等名
  言語処理学会第24回年次大会 (NLP2018)
[学会発表] A Neural Language Model for Dynamically Representing the Meanings of Unknown Words and Entities in a Discourse2017
- 著者名/発表者名
  Sosuke Kobayashi, Naoaki Okazaki, and Kentaro Inui
- 学会等名
  Proceedings of the Eighth International Joint Conference on Natural Language Processing (IJCNLP 2017)
- 国際学会
[学会発表] A Crowdsourcing Approach for Annotating Causal Relation Instances in Wikipedia2017
- 著者名/発表者名
  Kazuaki Hanawa, Akira Sasaki, Naoaki Okazaki, and Kentaro Inui
- 学会等名
  Proceedings of the 31st Pacific Asia Conference on Language, Information and Computation (PACLIC 2017)
- 国際学会
[学会発表] Other Topics You May Also Agree or Disagree: Modeling Inter-Topic Preferences using Tweets and Matrix Factorization2017
- 著者名/発表者名
  Akira Sasaki, Kazuaki Hanawa, Naoaki Okazaki, and Kentaro Inui
- 学会等名
  Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)
- 国際学会
[学会発表] 深層学習の自然言語処理への応用2017
- 著者名/発表者名
  岡崎直観
- 学会等名
  情報処理学会連続セミナー2017 第4回：ディープラーニングの活用と基盤
- 招待講演
[学会発表] 自然言語処理を支える大規模計算資源2017
- 著者名/発表者名
  岡崎直観
- 学会等名
  第２回データサイエンス支援サービスシンポジウム
- 招待講演
[学会発表] トピックに関する因果関係知識を利用した賛否分類2017
- 著者名/発表者名
  塙一晃, 佐々木彬, 岡崎直観, 乾健太郎
- 学会等名
  第12回NLP若手の会シンポジウム
[学会発表] Wikipediaを知識源に用いた文書検索と読解によるクイズ解答システム2017
- 著者名/発表者名
  鈴木正敏, 松田耕史, 岡崎直観, 乾健太郎
- 学会等名
  第12回NLP若手の会シンポジウム
[備考] 日本語Wikificationコーパス
- URL
  http://www.cl.ecei.tohoku.ac.jp/jawikify/
[備考] Wikipedia記事への促進・抑制関係付与コーパス
- URL
  http://www.cl.ecei.tohoku.ac.jp/wikipedia_pro_sup/

2017 年度 実績報告書

分散表現と構成的意味計算に基づくテキストと知識ベースの頑健なグランディング

研究代表者

岡崎 直観 東京工業大学, 情報理工学院, 教授 (50601118)

研究成果

[雑誌論文] A Joint Neural Model for Fine-Grained Named Entity Classification of Wikipedia Articles2018

著者名/発表者名

雑誌名

DOI

[雑誌論文] 関係パタンの分散表現の計算2017

著者名/発表者名

雑誌名

DOI

[雑誌論文] Supervised Approaches for Japanese Wikification2017

著者名/発表者名

雑誌名

DOI

[学会発表] Generating Text with Deep Neural Networks2018

著者名/発表者名

学会等名

[学会発表] エンコーダ・デコーダモデルによるテキスト生成2018

著者名/発表者名

学会等名

[学会発表] 自然言語処理における深層学習の進展2018

著者名/発表者名

学会等名

[学会発表] 読解による解答可能性を付与した質問応答データセットの構築2018

著者名/発表者名

学会等名

[学会発表] ニューラルネットを用いた多方言の翻訳と類型分析2018

著者名/発表者名

学会等名

[学会発表] A Neural Language Model for Dynamically Representing the Meanings of Unknown Words and Entities in a Discourse2017

著者名/発表者名

学会等名

[学会発表] A Crowdsourcing Approach for Annotating Causal Relation Instances in Wikipedia2017

著者名/発表者名

学会等名

[学会発表] Other Topics You May Also Agree or Disagree: Modeling Inter-Topic Preferences using Tweets and Matrix Factorization2017

著者名/発表者名

学会等名

[学会発表] 深層学習の自然言語処理への応用2017

著者名/発表者名

学会等名

[学会発表] 自然言語処理を支える大規模計算資源2017

著者名/発表者名

学会等名

[学会発表] トピックに関する因果関係知識を利用した賛否分類2017

著者名/発表者名

学会等名

[学会発表] Wikipediaを知識源に用いた文書検索と読解によるクイズ解答システム2017

著者名/発表者名

学会等名

[備考] 日本語Wikificationコーパス

URL

[備考] Wikipedia記事への促進・抑制関係付与コーパス

URL

2017 年度実績報告書

岡崎直観東京工業大学, 情報理工学院, 教授 (50601118)