研究課題
自然言語推論システムccg2lambdaは、組合せ範疇文法(CCG)による統語解析、高階論理による意味合成、定理自動証明器を組み合わせた自然言語推論システムである。ニューラル自然言語処理の研究が進展をみせる中で、自然言語理解における限界も明らかになりつつあり、ccg2lambdaのような理論言語学と深層学習のハイブリッドアプローチの重要性はますます増しつつある。令和2年度は、(1) 形式統語論および形式意味論の最新の知見に基づく構造的言語処理として、ccg2lambdaによる比較構文の論理推論の研究、および (2) ccg2lambdaに替わる意味の理論である依存型意味論(DTS)による自動定理証明アルゴリズムの開発に取り組んだ。(1) ccg2lambdaの利点として、標準的な形式意味論の分析に基づいた深い意味解析が可能であることが挙げられるが、一方で形式意味論の分析は必ずしも統一されておらず、異なる言語現象に対して異なる枠組みに基づく分析がなされていることがある。たとえば副詞の意味はevent意味論に基づいて分析され、比較構文はdegree意味論に基づいて分析されるが、本研究では、副詞の比較構文という両者が相互作用する構文を取り上げ、event意味論とdegree意味論の統一理論を設計し、ccg2lambda上で実装するとともに、言語的に困難な問題を含む様々なNLIデータセットを用いて評価した。その結果、従来の論理ベースのシステム、および深層学習ベースのシステムと比較して、高い精度を達成した。(2) 依存型意味論による自動定理証明:自然言語の意味の理論として有力な依存型意味論(DTS)は、ΠΣ断片については、すでに型推論アルゴリズム(Bekki and Sato 2015)が存在するが、R2年度の研究ではHaskellによる証明探索アルゴリズムを実装することに成功した。
2: おおむね順調に進展している
コロナ禍によって予定していた学会参加による情報収集、学会発表による成果発表が実現できない時期が続いたが、一方で、3件の査読付き国際学会論文発表、2件の国内学会発表、2件の国際学会招待講演、1件のメディア記事(日経サイエンス)があり、おおむね順調な成果を挙げたと考えられる。
最終年度であるR3年度は、いよいよ理論言語学と深層学習のハイブリッドアプローチとして、1) 日本語CCGパーザlightblueに、ニューラル言語モデルによる形態素解析・格解析器を組み合わせる研究、および 2) 統語解析における制約違反をテンソル表現し、その重みを深層学習によって最適化する研究、の2つに取り組む。また、DTSの証明探索アルゴリズムは高い適合率を示すものの再現率には課題が残るため、2021年度においても、ニューラル言語モデルとの接続可能性も視野に入れつつ引き続き取り組む。
すべて 2021 2020
すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 2件) 学会発表 (5件) (うち国際学会 3件、 招待講演 2件) 学会・シンポジウム開催 (1件)
Proceedings of the COLING2020 (short paper), Barcelona, Spain (Online)
ページ: 1758-1764
10.18653/v1/2020.coling-main.156
Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics Student Research Workshp (ACL2020-SRW), Seattle, USA.
ページ: 263-270
10.18653/v1/2020.acl-srw.35