2017 Fiscal Year Annual Research Report
Grounding text and knowledge base by using distributed representation and their compositions
Project/Area Number |
15H05318
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
岡崎 直観 東京工業大学, 情報理工学院, 教授 (50601118)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 自然言語処理 / 知識獲得 / 意味解析 / 表現学習 / 分散表現 / 深層学習 / 意見分析 / 質問応答 |
Outline of Annual Research Achievements |
計算機による自然言語の理解・推論を実現するため、テキストを知識に対応付ける(グランディングする)手法、及びその実タスクへの応用に関する研究を進めた。昨年度までの研究成果を活用するため、知識源としてWikipediaを主に採用した。実タスクとしては、質問応答と賛否分析に取り組んだ。 質問応答では、与えられた質問文に対して、その回答の候補を含むWikipedia記事を対応付け、Wikipedia記事の読解により答えを出力するアプローチに取り組んだ。早押しクイズの約12,000件の質問に対し、約46,000件のWikipedia記事との対応を明らかにしたデータセットを作成した。このデータセットを用いることで、質問の答えがWikipediaに見当たらない場合、という新しい問題設定を提起し、その状況を考慮することの効果を検証した。 昨年度までに、Wikipediaの記事の中で言及される促進・抑制などの因果関係の認識に取り組んだ。この因果関係知識を活用した賛否分析という実タスクに取り組むため、14,000件のソーシャルメディアの投稿を収集し、大阪都構想やプレミアムフライデーなどの7話題に対する賛否を付与したデータを構築した。このデータを分析し、テキストと因果関係知識の対応付けの必要性を調査したところ、約1/3の投稿において対応付けが必要であることが分かり、本研究の重要性が示された。 ソーシャルメディアのテキストから賛否を分類するため、昨年度までに「〇〇というトピックに賛成する人は××というトピックにも賛成する」という形の知識を抽出する手法を提案した(今年度に自然言語処理分野の最難関国際会議であるACLで発表)。この研究を拡張し、ユーザの日々の投稿と獲得した知識を対応付ける手法を考案した。その実験結果より、テキストと知識を対応付けることで意見分析の精度が向上することを実証した。
|
Research Progress Status |
29年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
29年度が最終年度であるため、記入しない。
|
Research Products
(17 results)