研究課題/領域番号 |
20K19868
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 東京大学 (2021-2023) 国立研究開発法人理化学研究所 (2020) |
研究代表者 |
谷中 瞳 東京大学, 大学院情報理工学系研究科, 准教授 (10854581)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2022年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2021年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | 自然言語推論 / 体系性 / 構成性 / 深層学習 / 自然言語処理 / 形式意味論 / 意味解析 / 事前訓練済み言語モデル / 構成性原理 / 人工知能 / 汎化性能 / 単調性 / 推移性 |
研究開始時の研究の概要 |
文の意味を計算処理可能な形式で表し、文と文との意味的関係を判定する含意関係認識の実現は、計算機による言語理解に向けて解決すべき最重要課題である。近年、深層学習に基づく言語モデルを用いた含意関係認識の研究が盛んに行われているが、文の構成的意味における言語モデルの表現力は明らかではなく、未知のデータに対する頑健性や表現学習の効率性が不透明である。一方で、形式意味論では、文の構成的意味を推論の妥当性から分析する研究が成熟しつつある。そこで本研究では、形式意味論と自然言語処理の融合による構成的言語モデルの実現を目指す。
|
研究成果の概要 |
深層学習を用いた自然言語処理の研究が活発に進められている。しかし、深層学習のモデルは、文の構成的な意味の扱いが明らかでなく、未知のデータに対する頑健性が不透明である。そこで本研究では、形式意味論と自然言語処理の知見を融合して、深層学習のモデルの文の意味の扱いを明らかにし、文の構成的な意味を考慮した言語処理技術の開発に取り組んだ。具体的には、英語と日本語の推論ベンチマークを構築し、現在のモデルの汎化性能の課題を特定した。さらに、文の意味を構成的に解析し文間の推論を行う推論システムの開発を進めた。得られた成果の一部は自然言語処理のトップ国際会議ACL、トップジャーナル誌TACLに採択された。
|
研究成果の学術的意義や社会的意義 |
本研究成果の中で特定された深層学習のモデルの文の意味における汎化性能の課題は、大規模言語モデルの信頼性に関わり、社会的影響が大きいものである。また、既存の自然言語推論ベンチマークの多くは英語であり、日本語の自然言語推論ベンチマークの枯渇は日本語の言語処理技術の発展に向けて深刻な問題である。本研究成果の一部である日本語の自然言語推論ベンチマークは、いずれも研究利用可能な形で公開しており、大規模言語モデルの基礎解析や日本語の言語処理技術の評価に貢献するものである。
|