研究実績の概要 |
下記の二つの課題それぞれに対して、次のような成果が得られた。
(1) 課題1: 論述文からの構造的知識の抽出技術の開発 一次知識の構造化の前段階として、大規模コーパスからの一次知識の抽出、一次知識の表現方法についての基礎的検討を行った。具体的には、約2万件の自然言語処理の論文データを集めた ACL Anthology Reference Corpus より、数百万のオーダで関係知識(一次知識)の抽出を行い、その中に (TFIDF, is used for, feature weighting) のような有用な関係が多く含まれることがわかった。さらに、大規模 Web コーパスより 20 億個の因果関係知識を抽出し、知識表現として複単語表現を考慮することの重要性を実験により確認した(佐々木ら 2016)。また、スクリプト的な知識の表現方法として、RNN エンコーダ・デコーダモデルにより得られる分散表現的アプローチについても検討を行い、従来の記号的アプローチに対する有用性を実験により確認した (Roemmele et al. 2017)。
(2) 課題2: 構造的知識に対する基礎的演算の実現 構造的知識間の関係認識の枠組みとして、論理推論に基づく枠組みについて検討し、論理に基づく仮説推論の一種である Etcetera Abduction (Gordon AAAI2017) の推論効率を改善することに成功した (Inoue et al. 2017)。また、本研究の応用先の一つであるディベート理解を見据え、ディベート理解のタスクを設計した。Argumentation Mining コミュニティで構築された中規模エッセイコーパスに対して実際にアノテーションを行い、アノテーション結果の分析を行った (Reisert et al. 2017)。
|