2020 Fiscal Year Annual Research Report
関係知識と非定形知識の利用を統合した自然言語読解システムの構築
Project/Area Number |
19J13238
|
Research Institution | Tohoku University |
Principal Investigator |
鈴木 正敏 東北大学, 情報科学研究科, 特別研究員(DC2)
|
Project Period (FY) |
2019-04-25 – 2021-03-31
|
Keywords | 自然言語処理 / 知識処理 / 質問応答システム / 言語モデル / クイズ |
Outline of Annual Research Achievements |
ユーザの入力する質問に対して適切な答えを出力する質問応答システムは、自然言語処理技術の重要な応用問題として長年の研究が続けられている。近年では、深層学習技術の急速な進展を背景に、自然言語処理の各問題で深層学習を活用した新たな手法が提案されるようになり、質問応答システムの研究においても新たな問題設定や手法が提案されている。 研究員は本年度までに、質問応答システムの現代的な2つのアプローチである、与えられる文書を読解することによって質問の答えを導き出す「オープンブック質問応答」と、外部の文書や知識源を参照することなしに言語モデルが保持する知識のみを頼りに質問に答える「クローズドブック質問応答」のそれぞれについて研究を行った。オープンブック質問応答に対しては、従来の問題設定に存在していた「質問は与えられる文書の読解によって必ず解答できる」という仮定が、オープンブック質問応答の性能低下の要因となっていることに着目し、質問の解答可能性の判別を行う文書読解モデルを提案した。提案手法により構築した文章読解モデルを応用することにより、質問応答システムの解答抽出・解答統合の性能が向上することを実験により確認した。クローズドブック質問応答に対しては、既存手法で主流となっていたモデルの大型化に頼らずに、訓練データの工夫・拡張によって質問応答性能の向上を図るデータ指向の手法を提案した。提案手法では、百科事典の文章を利用して訓練データを拡張することにより、言語モデルの質問応答性能の向上を、従来手法よりも大幅に少ないパラメータ数で実現した。この結果は、言語モデルに世界知識(非定型知識)を効率的に持たせる方法について新たな知見をもたらすものである。 さらに本年度は、国内における質問応答システムの研究を促進するため、質問応答システムの評価型ワークショップを開催し、研究分野の発展への貢献を行った。
|
Research Progress Status |
令和2年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和2年度が最終年度であるため、記入しない。
|