研究課題/領域番号 |
21K00016
|
研究機関 | 慶應義塾大学 |
研究代表者 |
峯島 宏次 慶應義塾大学, 文学部(三田), 准教授 (80725739)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 自然言語推論 / 形式意味論 / 証明論 / 型理論 |
研究実績の概要 |
本研究は、形式意味論と現代論理学の証明論・型理論の手法を応用して、自然言語の合成的意味論の枠組みを構築し、計算言語学の領域における含意関係認識(自然言語推論)の研究にも利用可能な意味解析・推論システムを確立することを目的とする。本年度は、(1)形式意味論的な研究として、前提・照応の研究、および、量化文と比較構文を中心とする合成的意味論と論理推論の研究を行った。またそれと並行して、(2)含意関係認識の基礎的な研究として、近年人工知能・計算言語学の文脈で活発に研究されているニューラルネットワーク(深層学習)に基づくアプローチと記号的・論理的アプローチを体系的に比較する一連の研究を行った。(1)については、依存型に基づく自然言語意味論、特に前提の研究を進めると同時に、英語・日本語の自然言語文を論理式に変換し、数量表現を含む複雑な推論を行うシステムを整備し、多様な言語現象に適用することを試みた。(2)については、深層学習の手法と記号論理的手法を包括的に比較するため、推論の推移性と体系性に着目した含意関係認識データセットを構築し、最近の深層学習モデルの汎化性能をテストした。同時に、理論言語学・形式意味論の知見に基づいて、単語の重複など単純なヒューリスティックスでは解けない推論パターンを網羅的に含む推論テストセットを構築した。これらは人間にとっては容易な推論であるが、現在主流の手法では解くことが困難なものを体系的に収集したものであり、自然言語推論の計算モデルの推論能力、体系性、合成性をテストする言語資源となりうるものである。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
今年度の目標であった自然言語の合成的意味論・推論システムの基盤の整備、及び、今後の研究の基礎となる推論データセットの構築はほぼ順調に進展した。依存型に基づく前提の研究は国際学会(LACL)において論文を発表した。比較表現の合成的意味論と推論システムの研究については論文を投稿中である。また理論言語学と計算言語学の交流を目指した国際ワークショップ(ILFC Seminar)において、これら一連の成果を概観する招待講演を行った。形式意味論的な観点からデータセットを構築し、深層学習の手法を評価・分析する研究は、計算言語学の分野の主要な国際カンファレンス(EACL, ACL)、国際ワークショップ(BlackboxNLP)において発表を行い、これをさらに発展させた論文を準備中である。本研究課題は、理論の基盤と応用の両面に関して順調に進展したと言える。
|
今後の研究の推進方策 |
本年度に主に進めた合成的意味論・推論システムの構築とその含意関係認識への応用をさらに進める。特に前提・照応の研究についてはこれまでの理論的成果を踏まえて、計算モデルの構築を進める。また初年度に構築した推論データセットを活用して、計算言語学で伝統的に主流であった1階述語論理によるエンコーディングの手法と、形式意味論で主流であった高階論理の手法を体系的に比較し、自然言語推論のための証明システムの整備・拡張を進める。
|
次年度使用額が生じた理由 |
新型コロナウイルス(COVID-19)による国内学会・国際学会・ミーティングの中止、及び、参加取りやめのため、計画変更の必要が生じ、次年度使用額が生じた。今後は徐々に現地開催に移行しつつある学会への参加、論文投稿費など、研究の公開・発信に必要な費用に当てる予定である。
|