2022 Fiscal Year Annual Research Report
先行文脈から動的に得る知識と事前学習で得る静的な知識を融合した文章の意味構造解析
Project/Area Number |
19K12112
|
Research Institution | Tohoku University |
Principal Investigator |
松林 優一郎 東北大学, 教育学研究科, 准教授 (20582901)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | 自然言語処理 / 省略解析 / 意味構造解析 |
Outline of Annual Research Achievements |
本研究課題では、文を「正確に読む」ために必須となる省略内容の解析技術の向上を目指し、(1)先行文脈の文意の蓄積 (=動的知識) に基づいて後方の意味を理解する解析モデルの構築と、(2)推論に必要な常識的知識 (=静的知識) の効果的・効率的な表現方法の確立、(3)これら動的知識と静的知識を融合した自然な推論に基づく意味解析技術の構築を行ってきた。 延長年度である今年度は、これまでの研究成果による発展課題として現れた、読解時のみならず文章記述時にどのような方法で記述内容の省略の是非を決定するかを説明するための計算モデルの研究を行った。この目的のために昨年度より作成してきた、人間が文章内の内容を省略すべきかそうでないかの妥当性を判断したパイロットデータを分析し、より高品質で詳細な分析が可能なデータを収集するための収集のプロセスを改善方法を模索し、結果として高品質なデータの作成を達成した。収集したデータにもとづいて、人間の読者間の判断のブレ、著者と読者間のブレ、判断の根拠となる因子等の分析を行うとともに、人間の省略判断を模倣する計算モデルを作成し、その性能について細部の分析を行った。結果として、現在の最先端の日本語言語モデルは、人間の判断をある程度は模倣できるが、同等の能力には至らないことが分かった。作成したデータや研究成果はそれぞれ研究資源、研究論文として公開した。 加えて、内容に誤りを含む文章の理解に関する研究として記述式問題の自動採点に関する評価研究を行い、国際会議論文として報告した。
|
Research Products
(5 results)