研究課題/領域番号 |
21H03502
|
研究機関 | 国立情報学研究所 |
研究代表者 |
相澤 彰子 国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 対話システム / 意味解析 / 基盤化 / 言語モデル / 視覚言語 |
研究実績の概要 |
本研究では、複雑な作業を言語でコンピュータに指示するための対話技術の研究に取り組む。ここでの「複雑な作業」とは、事前登録した関数を呼び出すだけでは解決できず、複数の関数(API)の呼び出しや詳細な条件設定などが必要となる処理である。このような複雑な作業は、単発の自然な発話では指示が困難で、現在のスマートスピーカやオンラインチャットの技術では扱うことができない。本研究では、その限界を克服するための中核的な技術として、対話による共通理解モデルの構築(=「基盤化」)に焦点をあてている。そして、「エンティティ参照の基盤化」、「作業手順の基盤化」、および「対話知識の獲得」の3つの課題を設定して、言語、視覚、計算プログラムが融合した環境に適応する新しい基盤化手法の研究開発に取り組んでいる。
初年度である2021年度は、対話において複数の対話者が発話中で共通に参照する対象を同定するための技術に焦点をあてて、時間変化を伴う環境でのタスク設計とコーパス構築を行った。また、このコーパスを用いて「時間表現」の言語解析およびベースラインとなる対話モデルの提案・改善に取り組んだ(エンティティ参照の基盤化)。2021年度ではまた、発話内容をコンピュータで実行可能なコマンド列に変換するための技術として、自然言語文クエリをSQLクエリに変換する意味解析に関して研究動向を調査するとともに、自然言語文中の数値表現の抽出およびタイプ判定に基づく複雑なSQLクエリ生成の自動生成の研究に取り組んだ(「作業手順の基盤化」)。さらに対話において必要となる数量的知識や視覚情報の埋め込み表現に関する研究を進めた(「対話知識の獲得」)。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
時間変化を伴う環境でのタスク設計とコーパス構築については、クラウドソーシングにより新たな共通基盤対話コーパスを公開するとともに(https://github.com/Alab-NII/dynamic-onecommon)、共通基盤の維持に用いられる言語表現や対話モデルのふるまいを分析した成果を国際ジャーナル1篇で発表した(Udagawa et al., 2021)。また、文章中に出現する数字表現の文脈依存型の埋め込み表現について、予測タスクを用いた埋め込み表現の獲得手法を検討し、複数の評価用データセットを横断的に用いて性能を評価した結果を国際ワークショップで報告した(Sakamoto et al., 2021)。さらに、視覚情報の埋め込み表現について、トランスフォーマー型の事前学習済み視覚言語モデルに焦点をあて、代表的な5つのモデルについて言語理解タスクに注目した性能比較および分析を行った(https://github.com/Alab-NII/eval_vl_glue)。単純な従来の視覚言語タスクと、複雑な推論を含む言語理解タスクの両方を対比した結果をまとめ、国際会議で発表した(Iki et al., 2021)。
|
今後の研究の推進方策 |
2022年度では、数量的知識の獲得および視覚情報の埋め込み表現に関する研究を引き続き実施する。また、自然言語クエリをSQLクエリに変換する意味解析については、自然言語文中のエンティティとデータベースの構成要素(項目名や値など)の対応付け手法の開発に取り組み、特に未知のデータベースにも適応可能な汎用的な解析手法の開発を目指す。また対話の基本ユニットとなる質問応答については2021年度もQAモデルの頑健性に関する研究に取り組んで成果を発表しており(Shinoda et al., 2021)、対話知識獲得の課題として研究を継続する。
|