2023 Fiscal Year Research-status Report
証明論と型理論に基づく自然言語の形式意味論の新しい枠組み
Project/Area Number |
21K00016
|
Research Institution | Keio University |
Principal Investigator |
峯島 宏次 慶應義塾大学, 文学部(三田), 准教授 (80725739)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Keywords | 型理論 / 証明論 / 自然言語推論 / 形式意味論 / 大規模言語モデル |
Outline of Annual Research Achievements |
本研究は、形式意味論と現代論理学の証明論・型理論の手法を応用して、自然言語の合成的意味論の枠組みを構築し、計算言語学の領域における自然言語推論(含意関係認識)の研究にも利用可能な意味解析・推論システムを確立することを目的としている。本年度は、(1)形式意味論的な研究として、様々なタイプの疑問文を中心とする合成的意味論と論理推論の研究を行った。またそれと並行して、(2)自然言語推論の基礎的な研究として、記号的・論理的アプローチとニューラルネットワーク(深層学習)に基づくアプローチを体系的に比較する一連の研究を行った。(1)については、型理論に基づいて英語・日本語の自然言語文を高階論理の論理式に変換し、疑問表現を含む複雑な推論・質問応答を行うシステムを構築し、多様な言語現象に適用することを試みた。(2)については、まず深層学習モデルの推論性能を体系的に評価するため、基本的な量化推論、特に三段論法に着目した自然言語推論データセットを構築した。その上で、現状の大規模言語モデルを用いて一連の評価実験を行った。それにより、現状のモデルでは量化推論を含む論理推論に弱点があり、人間と同様の一定のエラー傾向(推論バイアス)があることを体系的に明らかにした。構築したデータセットは人間の推論能力との比較のもとで、大規模言語モデルを含む自然言語推論の計算モデルの推論能力をテストする言語資源として活用可能なものであり、今後公開する予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
今年度の目標であった(1)自然言語の合成的意味論・推論システムの整備、及び、(2)量化推論を中心とした自然言語推論データセットの構築とそれを利用した深層学習モデルの体系的な評価はほぼ順調に進展した。(1)の成果は、12月に香港で開催されたPacific Asia Conference on Language, Information and Computation (PACLIC 37)において発表し、Proceedings論文を出版した。(2)については、 6月にフランスで開催されたNatural Logic Meets Machine Learning (NALOMA) ワークショップで発表し、Proceedings論文に成果をまとめた。これらの成果に基づく招待講演を3月にフランス・IHPSTで行い、さらに、形式意味論と深層学習の背景にある分布意味論を比較した招待講演を日本語文法学会で行った。また、深層学習に基づくアプローチと記号的アプローチを推論の体系性の観点から比較する展望論文を執筆し、雑誌『認知科学』に発表した。
|
Strategy for Future Research Activity |
本年度に主に進めた合成的意味論・推論システムの構築とその自然言語推論への応用をさらに進める。特に高階論理の手法を中心に、自然言語推論のための証明システムの整備・拡張を進める。また、これまでに構築した自然言語推論データセットをさらに拡張すると同時に、データセットを活用して、深層学習モデルの推論能力の体系的な評価を行う手法の開発をさらに進める。
|
Causes of Carryover |
新型コロナウイルス(COVID-19)による影響が引き続きあり、国内学会・国際学会・ミーティングのオンライン・ハイブリッド化のため、計画変更を行い、次年度使用額が生じた。 徐々に現地開催に移行しつつある学会への参加、論文投稿費などど、研究の公開・発信に必要な費用に当てる予定である。
|
Research Products
(9 results)