研究課題/領域番号 |
22H03641
|
配分区分 | 補助金 |
研究機関 | 東京農工大学 |
研究代表者 |
藤田 桂英 東京農工大学, 工学(系)研究科(研究院), 教授 (00625676)
|
研究期間 (年度) |
2022-04-01 – 2026-03-31
|
キーワード | マルチエージェントシステム / 自動交渉 / 機械学習 / 強化学習 / 合意形成支援 |
研究実績の概要 |
マルチエージェントシステムにおける学術研究において,エージェント間の衝突を解決できる自動交渉は必須の技術となっている.近年,交渉問題ごとに専門家が戦略やプロトコルを一から構築する必要はなく高い性能を示すことから,自動交渉と機械学習の融合したアプローチが注目されている.しかし,自動交渉戦略の一部のみ実現した既存研究が存在するのみで,自動交渉戦略の全体を一つの機械学習フレームワークで実現した研究は提案されていない.そこで,自動交渉と機械学習の融合を実現するために必要な学習フレームワーク,および,それらを実現するための方法論と必要な資源,その構築方法に関する研究を実施した.上記を実現するために,交渉エージェント戦略および効用関数,交渉プロトコルを獲得するための機械学習モデルであるEnd-to-EndモデルやEncoder-Decoderモデルを検証するとともに,学習用資源と共通評価基盤の構築を行った. エージェントが交渉相手から受け取った提案内容から,ダイレクトに次の交渉行動(相手からの提案を拒否して何を提案するか,相手の提案内容を受諾する,交渉をやめる)を出力する包括的な交渉戦略を強化学習により獲得するアプローチをEnd-to-Endな学習フレームワークにより実現した.これは,既存の学習フレームワークより高性能であることが期待でき,どのような交渉問題に対して単一の学習フレームワークにより包括的な交渉戦略を獲得できる.既存のヒューリスティックなアプローチによる自動交渉戦略との比較により,深層強化学習により獲得した包括的な学習フレームワークが,既存研究と比較して高性能であることを明らかにした.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
交渉エージェント戦略および効用関数,交渉プロトコルを獲得するための機械学習モデルであるEnd-to-EndモデルやEncoder-Decoderモデルを検証するとともに,学習用資源と共通評価基盤の構築を行った. エージェントが交渉相手から受け取った提案内容から,ダイレクトに次の交渉行動(相手からの提案を拒否して何を提案するか,相手の提案内容を受諾する,交渉をやめる)を出力する包括的な交渉戦略を強化学習により獲得するアプローチをEnd-to-Endな学習フレームワークにより実現した.これは,既存の学習フレームワークより高性能であることが期待でき,どのような交渉問題に対して単一の学習フレームワークにより包括的な交渉戦略を獲得できる.既存のヒューリスティックなアプローチによる自動交渉戦略との比較により,深層強化学習により獲得した包括的な学習フレームワークが,既存研究と比較して高性能であることを明らかにした. 上記の成果から,本研究は当初の計画通りで進んでおり,おおむね順調に進展している.
|
今後の研究の推進方策 |
本研究では,交渉における論点数が多い場合や論点間に依存関係がある場合のような複雑な交渉ダイアログデータの作成とそれらのデータにおいて高い効用推定を行うことが可能な手法の開拓を行う.具体的には,クラウドソーシングを活用して複雑な交渉ダイアログデータ作成を行い,新たな学習フレームワークを開発することで,目標とする精度を達成する.最終的に,現実的な交渉問題設定(論点数が多い,論点間に依存関係が存在)において,新たに提案する手法が,高い精度で交渉参加者の効用を推定できることを明らかにする. また,自動交渉戦略の際に用いた機械学習アプローチを自動交渉プロトコルを自動的に獲得する新たな仕組みを構築する.
|