文の意味を計算処理可能な形式で表し、文と文との意味的関係を判定する含意関係認識の実現は、計算機による言語理解に向けて解決すべき最重要課題である。近年では、深層学習に基づくモデルを用いた含意関係認識の研究が盛んに行われているが、文の構成的な意味におけるモデルの表現力は明らかでなく、未知のデータに対する頑健性や表現学習の効率性が不透明である。一方で、形式意味論では、文の構成的な意味を推論の妥当性から分析する研究が成熟しつつある。そこで本研究では、形式意味論と自然言語処理の知見を融合して、深層学習に基づくモデルの文の構成的な意味における表現力を明らかにするとともに、文の構成的な意味を考慮した言語処理技術の実現を目指す。 最終年度では、日本語の時間推論を用いて深層学習のモデルが日本語の構成的な意味を理解しているか分析する手法を開発し、現在のモデルが時間に関わる意味を統一的に理解できていないことを明らかにした。また、文の構成的な意味を考慮した言語処理技術として、日本語症例テキスト中の複合語の意味を組合せ範疇文法と構成的意味論に基づいて解析し、テキスト間の推論を行うシステムMedC2lを開発した。さらに、構成的意味論に基づく意味解析の重要なコンポーネントである、言語学的に妥当な組合せ範疇文法のツリーバンクの構築を進めた。 研究期間全体を通して、英語・日本語の様々な体系性に基づいて深層学習の文の構成的な意味における表現力を分析する手法を構築し、現在の深層学習のモデルの可能性と課題を明らかにした。さらに、文の構成的な意味を考慮した言語処理技術として、構成的意味論に基づいて文の意味を解析しテキスト間の推論を行う推論システムの開発を進めた。得られた研究成果の一部は自然言語処理のトップジャーナル誌TACLと自然言語処理ジャーナル、認知科学ジャーナル、トップ国際会議ACL、EACLに採択された。
|