2020 Fiscal Year Research-status Report
自動交渉技術を用いた統計的意志決定過程推定手法の確立
Project/Area Number |
19K12131
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
山崎 啓介 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (60376936)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | シミュレーション / データ同化 / サロゲートモデル / 自動交渉 / マルチエージェント |
Outline of Annual Research Achievements |
昨年度に引き続き、2つのエージェント間の自動交渉における交渉時間データから各エージェントにおける交渉項目の選択傾向を推定する問題に取り組んだ。 昨年度は選択肢が2つという最も基本的な設定での分析を行ったが、本年度はこれをより一般的な選択肢数へ拡張することに成功した。 交渉のプロトコルに着目するとひとつ前の時間における相手エージェントの提案に対し、次の時刻で応答・さらなる提案をするという動作がマルコフ過程になっている。これを利用して交渉ダイナミクスを隠れマルコフモデルで表現できることを示した。隠れマルコフモデルは機械学習ではよく知られるモデルであり、そのパラメータ学習法が広く研究されている。エージェントの選択傾向の推定を隠れマルコフモデルの学習問題に帰着させることにより、これまでの機械学習で培われてきた様々な学習アルゴリズムを援用することが可能となった。これらの学習アルゴリズムを用いることで、自動交渉をシミュレーションし、その交渉時間データから選択傾向を表すパラメータを推定できることを確認した。 いくつかの基本的な交渉戦略を有するエージェントにおいては、その交渉時間分布のモーメントがある種の行列関数で記述できることを発見した。このクラスに属するエージェントについては隠れマルコフモデルの学習よりも高速にモーメントマッチングによる推定が可能である。 さらに大量のデータにおける推定を高速化するため、昨年度に開発した技術をいくつかのマルチエージェント型シミュレーションに適用し有用性を確かめた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
多くの自動交渉シナリオではエージェントが選択する項目は2つよりも多く、昨年度の結果の適用範囲が十分でない。本年度の拡張結果ではその問題を解決し広範囲の交渉シナリオにおいてエージェントの選択傾向の推定が可能になった。
|
Strategy for Future Research Activity |
多くの交渉シナリオでエージェント選択傾向推定が可能にあり、かつ大量データにおけるシミュレーション高速化技術が実際のマルチエージェントシミュレーションにおいて有効であることが実証されたため、今後は自動交渉の国際コンペティションで用いられるような実用的な交渉シナリオにおいて、推定が可能であるか、また推定結果が有効に活用可能であるかの検証を行う。
|
Causes of Carryover |
COVID19の影響により参加を予定していた国内研究会、国際会議および研究打ち合わせのすべてがオンライン開催になり旅費がかからなかったため。またシミュレーション専用計算機もテレワーク推奨により使用機会が失われるため購入を見合わせた。 これらに関しては来年度以降の学会・打ち合わせの旅費として利用、また持ち出し可能なスペックの計算機購入による規模を抑えたシミュレーション実証に変更などを検討し使用する予定。
|