2019 Fiscal Year Research-status Report
先行文脈から動的に得る知識と事前学習で得る静的な知識を融合した文章の意味構造解析
Project/Area Number |
19K12112
|
Research Institution | Tohoku University |
Principal Investigator |
松林 優一郎 東北大学, 教育学研究科, 准教授 (20582901)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 自然言語処理 / 意味構造解析 / 省略解析 |
Outline of Annual Research Achievements |
文を「正確に読む」ために必須となる省略解析の技術の性能は、未だ一般的な人間の読解能力と比べて大きな隔たりがある。本研究課題では、文章の一部分(多くは1、2文単位)だけを見て解析を行う従来型の意味解析手法を改良し、正確な意味理解に必要不可欠な要素である (1) 先行文脈の文意の蓄積(=動的知識)に基づいて後方の意味を理解する解析モデルの構築と (2) 推論に必要な常識的知識(=静的知識)の効果的・効率的な表現方法の確立、(3) これら動的知識と静的知識を融合した自然な推論に基づく意味解析の実現を行うことで意味解析技術の発展を目指している。 研究初年度である本年度は、省略解析モデルで一般的に入力として用いられている、文中の各単語の性質を数理的に表現しているベクトルを、現在解析を行っている文の文脈に応じて適切に変化させる文脈埋め込みモデルを用いた省略解析技術を構築し、この事によって従来モデルに比べて、特に日本語省略解析の精度を大幅に改善することに成功した。 また、省略解析に必要な常識的知識の効果的な学習方法の一つとして、事前に大規模データを用いて学習された言語モデルを使い、教師データ中の単語の一部を別の自然な語で言い換える事により、省略解析のための教師データを増強する手法を提案し、性能向上に有効であることを示した。 加えて、文中の省略箇所について、より推定の簡単な場所から徐々に期待度を上げながら反復的に解析を行うモデルを設計し、その効果を検証した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究課題の骨子となる2つの部分課題「文脈の蓄積モデル」及び「静的知識の推定モデルへの組み込み」についてそれぞれ概ね本年度計画に沿った成果を出せている。研究成果の対外発表も順調であり、言語処理分野で国内最大規模である言語処理学会で3件の発表を行った。今年度の成果については現在国際会議論文への投稿を準備している。
|
Strategy for Future Research Activity |
当初の研究計画にしたがって、引き続き「文脈の蓄積モデル」及び「静的知識の推定モデルへの組み込み」の精緻化を行っていく。静的知識の組み込みにあたっては、従来の(主語,述語,目的語)の三つ組などのテンプレート型ではなく、テンプレート非依存で知識の表現方法を制約しない(細部のニュアンスを落とさない)組み込み手法を引き続き模索していく。
|
Causes of Carryover |
今年度の研究成果を国際会議等で発表するための旅費として組み込むため、一部を次年度に繰り越す。
|
Research Products
(3 results)