研究実績の概要 |
計算機による自然言語の理解・推論を実現するため、テキストを知識に対応付ける(グランディングする)手法、及びその実タスクへの応用に関する研究を進めた。昨年度までの研究成果を活用するため、知識源としてWikipediaを主に採用した。実タスクとしては、質問応答と賛否分析に取り組んだ。 質問応答では、与えられた質問文に対して、その回答の候補を含むWikipedia記事を対応付け、Wikipedia記事の読解により答えを出力するアプローチに取り組んだ。早押しクイズの約12,000件の質問に対し、約46,000件のWikipedia記事との対応を明らかにしたデータセットを作成した。このデータセットを用いることで、質問の答えがWikipediaに見当たらない場合、という新しい問題設定を提起し、その状況を考慮することの効果を検証した。 昨年度までに、Wikipediaの記事の中で言及される促進・抑制などの因果関係の認識に取り組んだ。この因果関係知識を活用した賛否分析という実タスクに取り組むため、14,000件のソーシャルメディアの投稿を収集し、大阪都構想やプレミアムフライデーなどの7話題に対する賛否を付与したデータを構築した。このデータを分析し、テキストと因果関係知識の対応付けの必要性を調査したところ、約1/3の投稿において対応付けが必要であることが分かり、本研究の重要性が示された。 ソーシャルメディアのテキストから賛否を分類するため、昨年度までに「〇〇というトピックに賛成する人は××というトピックにも賛成する」という形の知識を抽出する手法を提案した(今年度に自然言語処理分野の最難関国際会議であるACLで発表)。この研究を拡張し、ユーザの日々の投稿と獲得した知識を対応付ける手法を考案した。その実験結果より、テキストと知識を対応付けることで意見分析の精度が向上することを実証した。
|