自動交渉における相互交換プロトコルという交渉環境について、プロトコルが定める交渉ダイナミクスと交渉戦略がもたらす影響について数理モデルを構成した。通常の自動交渉環境では交渉時間がリソースの一つであるため、これが長くなると得られる効用が減少するように設定されるため、エージェントの戦略もそれに対応し交渉を継続する行動選択確率が減少するように設計されている。実際のエージェント戦略では交渉相手の提案内容に依存し複雑な意思決定アルゴリズムに従って交渉継続の判断がなされるため、例えアルゴリズムが開示されていても交渉が開始された後の挙動を解析することが困難であった。本研究において交渉継続確率の減少成分をモデル化することで、合意までに要する時間の分布、得られる効用の期待値などが交渉シミュレーションを実行せずに解析的に算出することが可能になった。また、これらの解析計算が可能な減少成分モデルクラスを定義した。 研究期間全体を通じて実施した研究の成果としては、以下のとおりである。(1)自動交渉データの整備:2者間の相互交換プロトコルにおいて異なる戦略を有する複数エージェントに対し、大量の交渉履歴データを作成した。(2)交渉履歴データからのパラメータ学習:当該プロトコルでは提案を交互に行っていくが、提案内容が開示されている場合について、次の提案内容を決定する確率をパラメータとするモデルを定義し、このパラメータ推定を機械学習の手法を援用することで実現した。(3)行動データからのパラメータ推定:提案内容が開示されない場合において、エージェントが交渉を継続するか合意するかという行動のみから上述のパラメータを推定するアルゴリズムを提案した。
|