研究課題
Wikipediaの記述を主な知識源とする知識ベース構築とそれを用いた意味談話解析に関するこれまでの研究を統合することによって、意味談話解析の中核的な部分問題である述語項構造解析および談話構造解析においてともに世界最高水準の性能を持つ技術を創出した。まず、述語項構造解析については、複数の省略の間に存在する、「一方の省略の先行詞がAであれば他方の省略の先行詞もAの可能性高い」といった潜在的な依存関係を訓練事例と知識の組合せによって捉える深層学習ベースの新しいアーキテクチャを構築し、標準的な日本語ベンチマークデータに対して世界最高精度を更新した。得られた成果はオープンソースの述語項構造解析器showcaseとして利用可能になっている。また、談話構造解析についても、文や節からなる談話単位の意味や役割を表現するための新しい分散表現方法を開発し、そこに対象ドメインの世界知識を組み込むことによって、標準的な論述構造解析ベンチマークデータに対して世界最高精度を達成した。とくに、従来の解析方法では困難であった、「BからAを帰結できることはCから導ける」のような論述の入れ子構造の解析において我々の手法は大きな精度改善を示しており、文脈情報とドメイン知識を統合的に表現してうまく解析に利用することの有効性を示すことができた。さらに、ドメイン知識による推論を意味の深い解析に繋げる研究でも、例えば「秘密保護法」と「情報漏洩」の抑制関係のようなドメイン知識を分散表現空間に埋め込み、ある種の「行間」を推論しながら意見表明テキストの意味解析を行う機構を構築し、知識注入による精度改善を確認する成果を得た。これらの成果により、大規模文書集合からの世界知識獲得とそうして得られた知識を用いた推論を意味談話解析と統合することによって、テキストの中で暗黙に語られている情報を復元する技術の足がかりが得られたと考えている。
平成30年度が最終年度であるため、記入しない。
すべて 2019 2018 その他
すべて 国際共同研究 (2件) 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (20件) (うち国際学会 11件)
In IEICE Transactions on Information and Systems
巻: Vol. E101-D, No. 12 ページ: pp.3209-3217