Creation of Harmony Technology Base between Machine Learning and Automated Negotiation
Project/Area Number |
23K24897
|
Project/Area Number (Other) |
22H03641 (2022-2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2022-2023) |
Section | 一般 |
Review Section |
Basic Section 61030:Intelligent informatics-related
|
Research Institution | Tokyo University of Agriculture and Technology |
Principal Investigator |
藤田 桂英 東京農工大学, 工学(系)研究科(研究院), 教授 (00625676)
|
Project Period (FY) |
2022-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥17,290,000 (Direct Cost: ¥13,300,000、Indirect Cost: ¥3,990,000)
Fiscal Year 2025: ¥3,770,000 (Direct Cost: ¥2,900,000、Indirect Cost: ¥870,000)
Fiscal Year 2024: ¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2023: ¥3,510,000 (Direct Cost: ¥2,700,000、Indirect Cost: ¥810,000)
Fiscal Year 2022: ¥5,590,000 (Direct Cost: ¥4,300,000、Indirect Cost: ¥1,290,000)
|
Keywords | 自動交渉 / マルチエージェントシステム / 強化学習 / 機械学習 / 合意形成支援 |
Outline of Research at the Start |
マルチエージェントシステムにおいて、エージェント間の衝突を解決できる自動交渉は必須の技術である。近年、高い性能を示すことから、交渉戦略やプロトコルの構築に機械学習を用いるアプローチが注目されている。そこで、自動交渉と機械学習の融合を実現するために必要な学習フレームワーク、および、それらを実現するための方法論と必要な資源、その構築方法を明らかにする。上記を実現するために、交渉エージェント戦略および効用関数、交渉プロトコルを獲得するための機械学習モデルであるEnd-to-EndモデルやEncoder-Decoderモデルを検証するとともに、学習用資源と共通評価基盤の構築を行う。
|
Outline of Annual Research Achievements |
マルチエージェントシステムにおける学術研究において,エージェント間の衝突を解決できる自動交渉は必須の技術となっている.近年,交渉問題ごとに専門家が戦略やプロトコルを一から構築する必要はなく高い性能を示すことから,自動交渉と機械学習の融合したアプローチが注目されている.しかし,自動交渉戦略の一部のみ実現した既存研究が存在するのみで,自動交渉戦略の全体を一つの機械学習フレームワークで実現した研究は提案されていない.そこで,自動交渉と機械学習の融合を実現するために必要な学習フレームワーク,および,それらを実現するための方法論と必要な資源,その構築方法に関する研究を実施した.上記を実現するために,交渉エージェント戦略および効用関数,交渉プロトコルを獲得するための機械学習モデルであるEnd-to-EndモデルやEncoder-Decoderモデルを検証するとともに,学習用資源と共通評価基盤の構築を行った. エージェントが交渉相手から受け取った提案内容から,ダイレクトに次の交渉行動(相手からの提案を拒否して何を提案するか,相手の提案内容を受諾する,交渉をやめる)を出力する包括的な交渉戦略を強化学習により獲得するアプローチをEnd-to-Endな学習フレームワークにより実現した.これは,既存の学習フレームワークより高性能であることが期待でき,どのような交渉問題に対して単一の学習フレームワークにより包括的な交渉戦略を獲得できる.既存のヒューリスティックなアプローチによる自動交渉戦略との比較により,深層強化学習により獲得した包括的な学習フレームワークが,既存研究と比較して高性能であることを明らかにした.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
交渉エージェント戦略および効用関数,交渉プロトコルを獲得するための機械学習モデルであるEnd-to-EndモデルやEncoder-Decoderモデルを検証するとともに,学習用資源と共通評価基盤の構築を行った. エージェントが交渉相手から受け取った提案内容から,ダイレクトに次の交渉行動(相手からの提案を拒否して何を提案するか,相手の提案内容を受諾する,交渉をやめる)を出力する包括的な交渉戦略を強化学習により獲得するアプローチをEnd-to-Endな学習フレームワークにより実現した.これは,既存の学習フレームワークより高性能であることが期待でき,どのような交渉問題に対して単一の学習フレームワークにより包括的な交渉戦略を獲得できる.既存のヒューリスティックなアプローチによる自動交渉戦略との比較により,深層強化学習により獲得した包括的な学習フレームワークが,既存研究と比較して高性能であることを明らかにした. 上記の成果から,本研究は当初の計画通りで進んでおり,おおむね順調に進展している.
|
Strategy for Future Research Activity |
本研究では,交渉における論点数が多い場合や論点間に依存関係がある場合のような複雑な交渉ダイアログデータの作成とそれらのデータにおいて高い効用推定を行うことが可能な手法の開拓を行う.具体的には,クラウドソーシングを活用して複雑な交渉ダイアログデータ作成を行い,新たな学習フレームワークを開発することで,目標とする精度を達成する.最終的に,現実的な交渉問題設定(論点数が多い,論点間に依存関係が存在)において,新たに提案する手法が,高い精度で交渉参加者の効用を推定できることを明らかにする. また,自動交渉戦略の際に用いた機械学習アプローチを自動交渉プロトコルを自動的に獲得する新たな仕組みを構築する.
|
Report
(1 results)
Research Products
(30 results)