研究課題/領域番号 |
19J13238
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 国内 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 東北大学 |
研究代表者 |
鈴木 正敏 東北大学, 情報科学研究科, 特別研究員(DC2)
|
研究期間 (年度) |
2019-04-25 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
1,700千円 (直接経費: 1,700千円)
2020年度: 800千円 (直接経費: 800千円)
2019年度: 900千円 (直接経費: 900千円)
|
キーワード | 自然言語処理 / 知識処理 / 質問応答システム / 言語モデル / クイズ |
研究開始時の研究の概要 |
自然言語の文章を計算機に理解させるためには、文章に明記されない知識を用いて推論を行うことが必要である。本研究では、事物間の関係を記述した関係知識と、事物についての定義文や因果関係といった非定形知識(説明的知識)の両方を統合的に利用した自然言語理解のシステムを研究する。具体的には、関係知識と非定形知識を用いた読解問題に取り組み、大規模なデータセットを用いた読解モデルの訓練および評価が可能な枠組みの上で追究する。
|
研究実績の概要 |
ユーザの入力する質問に対して適切な答えを出力する質問応答システムは、自然言語処理技術の重要な応用問題として長年の研究が続けられている。近年では、深層学習技術の急速な進展を背景に、自然言語処理の各問題で深層学習を活用した新たな手法が提案されるようになり、質問応答システムの研究においても新たな問題設定や手法が提案されている。 研究員は本年度までに、質問応答システムの現代的な2つのアプローチである、与えられる文書を読解することによって質問の答えを導き出す「オープンブック質問応答」と、外部の文書や知識源を参照することなしに言語モデルが保持する知識のみを頼りに質問に答える「クローズドブック質問応答」のそれぞれについて研究を行った。オープンブック質問応答に対しては、従来の問題設定に存在していた「質問は与えられる文書の読解によって必ず解答できる」という仮定が、オープンブック質問応答の性能低下の要因となっていることに着目し、質問の解答可能性の判別を行う文書読解モデルを提案した。提案手法により構築した文章読解モデルを応用することにより、質問応答システムの解答抽出・解答統合の性能が向上することを実験により確認した。クローズドブック質問応答に対しては、既存手法で主流となっていたモデルの大型化に頼らずに、訓練データの工夫・拡張によって質問応答性能の向上を図るデータ指向の手法を提案した。提案手法では、百科事典の文章を利用して訓練データを拡張することにより、言語モデルの質問応答性能の向上を、従来手法よりも大幅に少ないパラメータ数で実現した。この結果は、言語モデルに世界知識(非定型知識)を効率的に持たせる方法について新たな知見をもたらすものである。 さらに本年度は、国内における質問応答システムの研究を促進するため、質問応答システムの評価型ワークショップを開催し、研究分野の発展への貢献を行った。
|
現在までの達成度 (段落) |
令和2年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和2年度が最終年度であるため、記入しない。
|