研究課題/領域番号 |
21H03502
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 国立情報学研究所 |
研究代表者 |
相澤 彰子 国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
17,290千円 (直接経費: 13,300千円、間接経費: 3,990千円)
2023年度: 4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2022年度: 6,110千円 (直接経費: 4,700千円、間接経費: 1,410千円)
2021年度: 6,630千円 (直接経費: 5,100千円、間接経費: 1,530千円)
|
キーワード | 言語モデル / 多段階推論 / 対話システム / 意味解析 / 基盤化 / 視覚言語 |
研究開始時の研究の概要 |
本研究では、複雑な作業を言語でコンピュータに指示するための対話技術の実現を目指す。ここでの「複雑な作業」とは、事前登録した関数を呼び出すだけでは解決できず、複数の関数の呼び出しや詳細な条件設定などが必要となる処理である。このような複雑な作業は、単発の自然な発話では指示が困難であることから、本研究では対話に焦点をあてて、基盤化による共通理解モデルの構築や意味解析技術の研究に取り組む。
|
研究成果の概要 |
本研究では、複雑な作業を言語でコンピュータに指示するための自然言語処理の研究に取り組む。ここでの「複雑な作業」とは、一問一答のQAだけでは解決できず、多段階の推論や対話的なやりとりが必要となる処理である。研究では、複数の文書からの情報を組み合わせて質問に答える多段階言語推論、自然言語文をSQLクエリや実行可能なプログラムに変換する意味解析、対話において複数の対話者が発話中で共通に参照する対象を同定する基盤化等の研究に取り組み、言語モデルの構築や評価のためのデータセットを構築し、モデルの訓練および分析評価を通して、有用性を示した。
|
研究成果の学術的意義や社会的意義 |
生成型の言語モデルの登場と急速な大規模化によって、言語モデルの推論能力は劇的に向上している。このような言語モデルは、さまざまな場面における人間の作業支援ツールとして大きな期待が寄せられる一方で、実際の環境において必要となる複雑な指示の理解やコマンド生成などの能力については、さらなる改良が求められている。また、複数の情報ソースに分散する情報をさがしあてて、質問への正確な回答を生成する処理は、ハルシネーション対策としても重要である。本研究では、複雑な推論タスクに関する複数のデータセットを構築して公開しており、今後の研究開発における言語モデルの訓練・評価に貢献するものである。
|