研究課題/領域番号 |
22K12039
|
研究機関 | 筑波大学 |
研究代表者 |
若林 啓 筑波大学, 図書館情報メディア系, 准教授 (40631908)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
キーワード | 対話システム / 制御可能性 / 大規模言語モデル / 能動学習 / クラウドソーシング |
研究実績の概要 |
(1) 対話シナリオデータベースの高速拡充手法として,多腕バンディット問題と能動学習の枠組みを融合した適応的発話収集手法の設計と実装を行った.提案手法は,機械学習による言語理解モデルの確信度に基づいて,想定外なユーザ発話が最も予想される場面を推定し,当該の場面のユーザ発話を重点的に収集することで,対話AIの構築を効率化する.既存のデータセットを用いて予備実験を行い,提案手法が言語理解モデルの精度をより効率的に向上させることができることを部分的に確認した.また,この枠組みの中で大規模言語モデルによる生成発話を利用する手法について,DialoGPTを用いた予備的な実験を行い,更なる効率化を実現できる見通しを得た. (2) 対話シナリオで回答できない場合の発話生成手法として,あらかじめ生成された膨大な量の発話テキストを分類するためのヒューマン・イン・ザ・ループ・トピックモデリングの実装を行った.提案手法は,トピックモデルが自動的にテキストをグループ化して生成したトピックに対して,分析者がキーフレーズに基づくフィードバックを与えることにより,分析者の意図を効率的に反映してトピックを再編成する.シミュレーション実験により,提案手法を用いることで目的に合わせたトピック分類をより効率的に行えることを示した.この研究成果を論文誌論文1編にまとめて報告した.また,既存の言語理解モデルが,訓練データにない未知エンティティの認識に失敗しやすいことに着目し,文の構文構造をグラフニューラルネットワークにより考慮することで,未知エンティティの認識性能を向上させる手法を提案した.この研究成果をまとめた論文を国際会議に投稿中である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
対話シナリオデータベースの高速拡充手法の実現(課題A)については,多腕バンディット問題と能動学習の枠組みを融合した適応的発話収集手法の設計と実装を一通り完了し,既存のデータセットを用いた予備実験を行っている段階にあり,順調に進展している.この枠組みの中で大規模言語モデルによる生成発話を利用する手法については,DialoGPTを用いた予備的な実験を行い,更なる効率化を実現できる見通しを得ている. 対話シナリオで回答できない場合における適切なフォールバック発話生成手法の実現(課題B)については,研究実績の概要に記載の通り,多方面から課題に取り組み,要素技術の構築を進めている.発話生成手法としての実装および評価については,関連する技術の研究が分野内で急速に進んだため,状況の変化に合わせて当初の計画を若干修正する必要があったが,2023年度中には実質的に進展できる見込みである.
|
今後の研究の推進方策 |
対話シナリオデータベースの高速拡充手法の実現(課題A)については,2023年度により精緻な実験を行い,提案するアプローチの有効性を検証するとともに,国際会議での成果発表を目指す.また,対話用の事前学習済み汎用言語モデル(DialoGPT)による生成発話を活用するためのアルゴリズムについては発展の余地があるため,手法の改善にも引き続き取り組む. 対話シナリオで回答できない場合における適切なフォールバック発話生成手法の実現(課題B)については,引き続き要素技術の構築を進めるとともに,発話生成手法としての実装および評価に取り組む.また,これまでに汎用言語モデルの発話フィルタリングを行う手法が提案されていることから,このフィルタリングモデルを活用し,対象の対話AIのドメインに適応させてフォールバック発話生成に用いる手法の研究を進める方針である. 実世界の対話AI構築による提案技術の概念実証(課題C)に向けて,2023年度は計画の具体化を進める.提案技術を部分的に用いた対話AI構築の演習を模擬的に行い,提案技術の制御性,信頼性,効率性を検証するための実験設計を行うことで,2024年度の概念実証を円滑に進める準備を整える.
|
次年度使用額が生じた理由 |
成果発表が2022年度中には間に合わず,2023年度の支出になったことが主な理由である.2022年度中に評価用データセットの購入等を先行して行ったが,若干の次年度使用額が生じた.次年度使用分は,成果発表に係る旅費や論文掲載費として使用する計画である.
|