Technical Infrastructure for Rapid Construction of Controllable Conversational AI
Project/Area Number |
22K12039
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60080:Database-related
|
Research Institution | University of Tsukuba |
Principal Investigator |
若林 啓 筑波大学, 図書館情報メディア系, 准教授 (40631908)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2024: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2023: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2022: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
|
Keywords | 対話システム / 制御可能性 / 大規模言語モデル / 能動学習 / クラウドソーシング / 汎用言語モデル / シナリオデータベース |
Outline of Research at the Start |
対話AIは,窓口業務や相談業務の人的リソース問題の解消に重要な役割を果たすが,対話AIの構築には時間と予算がかかるため,コストに見合う成果を得ることが難しい.近年,自然なテキストを生成できる事前学習済みAIを用いて,目的別の対話AIを短期間に構築できる可能性が期待されているが,ブラックボックスなAIに依存するために発話内容が制御できないという深刻な課題がある.本研究では,事前学習済みAIとクラウドソーシングの力を結集して,発話内容を制御可能なシナリオ型対話AIを超短期間に構築する基盤技術を確立する.大学事務の窓口業務を自動化する対話AIなどの構築を通して,提案アプローチの概念実証を目指す.
|
Outline of Annual Research Achievements |
(1) 昨年度に引き続き,対話シナリオデータベースの高速拡充手法として,多腕バンディット問題と能動学習の枠組みを融合した適応的発話収集手法の設計と実装を行った.提案手法は,機械学習による言語理解モデルの確信度に基づいて,想定外なユーザ発話が最も予想される場面を推定し,当該の場面のユーザ発話を重点的に収集することで,対話AIの構築を効率化する.昨年度の予備実験の結果を踏まえて規模を拡大したシミュレーション実験を行い,提案手法が言語理解モデルの精度をより効率的に向上させることができる条件の解明を進めた. (2) 対話シナリオで回答できない場合の発話生成手法として,あらかじめ生成された膨大な量の発話テキストを分類するためのヒューマン・イン・ザ・ループ・トピックモデリングを開発した.提案手法は,トピックモデルが自動的にテキストをグループ化して生成したトピックに対して,分析者がキーフレーズに基づくフィードバックを与えることにより,分析者の意図を効率的に反映してトピックを再編成する.今年度は特に,人間のフィードバックを支援するためのキーフレーズ推薦手法や,トピックの内容を端的かつ正確に表現する自動トピックラベリング手法を開発し,シミュレーション実験によって人間の負担を軽減する効果を示した. (3) 適切な対話シナリオを同定するための言語理解モデルについて,訓練データにない未知エンティティの認識に失敗しやすい課題に着目し,文の構文構造をグラフニューラルネットワークにより考慮することで,未知エンティティの認識性能を向上させる手法を提案した.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
対話シナリオデータベースの高速拡充手法の実現に関して,統計的に信頼できる結果を得るために想定よりも多くの時間をかけてシミュレーションを行う必要があったため,やや進捗が遅れている.多腕バンディット問題と能動学習の枠組みを融合した適応的発話収集手法の設計と実装を一通り完了し,規模を拡大したシミュレーション実験により,提案手法が有効性を発揮する条件の解明が進んでおり,現在この研究成果を論文にまとめている状況である.
|
Strategy for Future Research Activity |
対話シナリオデータベースの高速拡充手法の実現(課題A)については,すでに得られている実験結果を論文にまとめている.2024年度中に国際会議等で発表し,提案アプローチの有効性を公表する予定である.また,大規模言語モデルによる生成発話を活用するためのアルゴリズムについては発展の余地があるため,手法の改善にも引き続き取り組む. 対話シナリオで回答できない場合における適切なフォールバック発話生成手法の実現(課題B)については,最新の大規模言語モデルの応用可能性が当初の想定を大きく上回って発展しているため,計画を変更してChatGPTを活用した実装を提案する予定である.この実装を課題Cの概念実証に組み込んで,その効果について検証する. 実世界の対話AI構築による提案技術の概念実証(課題C)については,2024年度はGoogleの提供するDialogflowサービスを利用したシステムの構築を行う.提案技術を用いた対話AI構築を実際に行い,提案技術の制御性,信頼性,効率性を検証する.
|
Report
(2 results)
Research Products
(6 results)