研究課題/領域番号 |
21K00016
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分01010:哲学および倫理学関連
|
研究機関 | 慶應義塾大学 |
研究代表者 |
峯島 宏次 慶應義塾大学, 文学部(三田), 准教授 (80725739)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2021年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 型理論 / 証明論 / 自然言語推論 / 形式意味論 / 大規模言語モデル / 合成的意味論 / 範疇文法 |
研究開始時の研究の概要 |
本研究は、現代論理学の形式的手法(特に証明論・型理論)を用いて自然言語の合成的意味論の枠組みを構築し、それを計算言語学の領域における自然言語推論(含意関係認識)の研究に応用可能な推論システムと結びつけることを目的とする。これにより、コーパス規模の実テキストを対象として形式意味論を構築し、自然言語推論を用いてその評価・比較・検証を行うことを目指す。
|
研究実績の概要 |
本研究は、形式意味論と現代論理学の証明論・型理論の手法を応用して、自然言語の合成的意味論の枠組みを構築し、計算言語学の領域における自然言語推論(含意関係認識)の研究にも利用可能な意味解析・推論システムを確立することを目的としている。本年度は、(1)形式意味論的な研究として、様々なタイプの疑問文を中心とする合成的意味論と論理推論の研究を行った。またそれと並行して、(2)自然言語推論の基礎的な研究として、記号的・論理的アプローチとニューラルネットワーク(深層学習)に基づくアプローチを体系的に比較する一連の研究を行った。(1)については、型理論に基づいて英語・日本語の自然言語文を高階論理の論理式に変換し、疑問表現を含む複雑な推論・質問応答を行うシステムを構築し、多様な言語現象に適用することを試みた。(2)については、まず深層学習モデルの推論性能を体系的に評価するため、基本的な量化推論、特に三段論法に着目した自然言語推論データセットを構築した。その上で、現状の大規模言語モデルを用いて一連の評価実験を行った。それにより、現状のモデルでは量化推論を含む論理推論に弱点があり、人間と同様の一定のエラー傾向(推論バイアス)があることを体系的に明らかにした。構築したデータセットは人間の推論能力との比較のもとで、大規模言語モデルを含む自然言語推論の計算モデルの推論能力をテストする言語資源として活用可能なものであり、今後公開する予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
今年度の目標であった(1)自然言語の合成的意味論・推論システムの整備、及び、(2)量化推論を中心とした自然言語推論データセットの構築とそれを利用した深層学習モデルの体系的な評価はほぼ順調に進展した。(1)の成果は、12月に香港で開催されたPacific Asia Conference on Language, Information and Computation (PACLIC 37)において発表し、Proceedings論文を出版した。(2)については、 6月にフランスで開催されたNatural Logic Meets Machine Learning (NALOMA) ワークショップで発表し、Proceedings論文に成果をまとめた。これらの成果に基づく招待講演を3月にフランス・IHPSTで行い、さらに、形式意味論と深層学習の背景にある分布意味論を比較した招待講演を日本語文法学会で行った。また、深層学習に基づくアプローチと記号的アプローチを推論の体系性の観点から比較する展望論文を執筆し、雑誌『認知科学』に発表した。
|
今後の研究の推進方策 |
本年度に主に進めた合成的意味論・推論システムの構築とその自然言語推論への応用をさらに進める。特に高階論理の手法を中心に、自然言語推論のための証明システムの整備・拡張を進める。また、これまでに構築した自然言語推論データセットをさらに拡張すると同時に、データセットを活用して、深層学習モデルの推論能力の体系的な評価を行う手法の開発をさらに進める。
|