2023 Fiscal Year Annual Research Report
Natural Language Interface Technology to Support Complex Tasks
Project/Area Number |
21H03502
|
Research Institution | National Institute of Informatics |
Principal Investigator |
相澤 彰子 国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 対話システム / 意味解析 / 基盤化 / 言語モデル / 視覚言語 |
Outline of Annual Research Achievements |
本研究では、複雑な作業を言語でコンピュータに指示するための対話技術の研究に取り組む。ここでの「複雑な作業」とは、一問一答のQAだけでは解決できず、多段階の推論や対話的なやりとりが必要となる処理である。2023年度は、意味解析および推論に焦点をあてて、以下の研究を進めた。まず、複数の文書からの情報を組み合わせて質問に答える必要がある「多段階言語推論(multihop reasoning)」について、明示的な推論パスを付与したデータセットを構築して、推論パスを用いた補助タスクが言語モデルの性能、頑健性、汎化能力に及ぼす影響の詳細な分析を行い、その結果を国際会議で報告した(Ho et al., 2023)。また、k近傍言語モデルに基づく数値埋め込み表現を提案し、数値にかかわる推論タスクにおける有効性を示した(Sakamoto et al., 2023)。さらに、推論において「多くの場合に成り立つ常識的な知識」と「特定の状況において与えられた情報から導かれる論理的な帰結」の2通りがあることに注目し、両者が矛盾する例を含むデータセットを構築した。これにより、両者の推論方法の使い分けが高度な推論タスクにおいて重要であり、現状の言語モデルではまだ十分なレベルに到達していないことを示した(Kondo et al., 2023)。
|
Research Progress Status |
令和5年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和5年度が最終年度であるため、記入しない。
|