研究課題/領域番号 |
20K23335
|
研究種目 |
研究活動スタート支援
|
配分区分 | 基金 |
審査区分 |
1001:情報科学、情報工学およびその関連分野
|
研究機関 | 国立情報学研究所 |
研究代表者 |
菅原 朔 国立情報学研究所, コンテンツ科学研究系, 助教 (10855894)
|
研究期間 (年度) |
2020-09-11 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | 自然言語処理 / 計算言語学 / 自然言語理解 / 文章読解 / 言語理解 / 機械読解 / 質問応答 |
研究開始時の研究の概要 |
言語理解を実現するシステムを着実に開発するには言語理解に関する精緻な分析と評価が必要であるが、既存のタスクでは「良い精度を出すシステムは実際に何が得意なのか」について十分な説明性が確保されていなかった。本研究は言語理解の評価のためのタスクである機械読解に焦点を当て、読解問題の回答に至るまでのプロセスを分解して補助的な問題として課すで詳細な評価を可能にするフレームワークの構築を目指す。
|
研究成果の概要 |
言語理解システムを着実に開発するには理解の過程に関する精緻な分析と評価が必要であるが、既存のタスクではシステムの能力について十分な説明性が確保されていなかった。本研究は読解問題に焦点を当て、回答に至るまでの根拠についての理解を補助的な問題として課すことで詳細な評価を可能にするデータセットを構築した。既存の選択式の読解問題に対してそれぞれの選択肢が正解・不正解になる根拠情報をクラウドソーシングで収集し、その根拠情報自体が答えになるような選択式の問題を作成することで元々の問題に対して根拠まで含めた一貫性のある理解がなされているかどうかを問えるようにした。
|
研究成果の学術的意義や社会的意義 |
言語理解を実現するシステムの構築は自然言語処理における最大の目標のひとつである。システムを着実に開発するには言語理解に関する精緻な分析と評価が必要であり、本研究によって得られたデータセットは読解問題の回答に至るまでのプロセスを分解して補助的な問題として課すことで詳細な評価を可能にした。これにより現状のシステムの限界が示され、本データセットは今後の改善を促進する上で重要な役割を果たす。
|