2013 Fiscal Year Annual Research Report
部分観測可能マルコフ決定過程を用いた不確実な観測下での繰り返しゲーム理論の再構築
Project/Area Number |
13J04426
|
Research Institution | Kyushu University |
Principal Investigator |
JOE YONGJOON 九州大学, システム情報科学府, 特別研究員(DC1)
|
Keywords | 繰り返しゲーム / 私的観測 / POMDP / 均衡解析 |
Research Abstract |
まず様々なゲームにおいて、利己的なエージェントが協力関係を維持可能であるかを解析した。多くのゲームの中でも利己的なエージェントが協力関係を築くことが難しいケースである、ステージゲームにおいてナッシュ均衡が存在しない、もしくは存在するがそれが協力ではなくより効率的な協力状態が別に存在する(収穫逓減の法則など)ケースなど、以前より経済学界で難問とされてきた課題を重点的に研究した。 その結果、新しい均衡戦略の発見及び、k期相互罰則が有効となる条件などを確認することが出来た。特にGo-Stop, Go-Stop-Blockゲーム(収穫逓減の法則を表す)に関する研究では、Go-Stopゲームでk期相互罰則が協力関係を維持できない理由を考察、Blockと言う行動とシグナルが必要となることを解明し、Go-Stop-Blockゲームで有効となることを示している。 また、既存の均衡探索アルゴリズムの効率化の段階を飛ばし、均衡判定に特化したソルバを開発・検証した。既存のPOMDPソルバを用いるアルゴリズムを利用する場合、判定が難しかった・出来ないシグナル領域が存在していた。それに対し新しいアルゴリズムの場合、一部多くの時間がかかる特殊なケースはあるものの、ほぼ全領域において正しい判定を得ることが可能となった。その上、均衡判定に特化したため、既存のPOMDPソルバにおける不実用な手続きが解消された。それにより、ごく稀な例外を除けば既存のアルゴリズムと比べ10~1000倍以上の速度での判定が可能となっている。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
1年目の計画目標の内、様々なゲームに関する解析及び探索アルゴリズムの効率化は予定通りに進んでいる。特にいくつかのゲームにおいては多くの成果を得られている。また2年目の計画であった均衡判定に特化したソルバの開発・検証を行った。 それに対し、有限状態機械及び私的観測における均衡の特性付けに関してはまだ後続の研究が必要である。
|
Strategy for Future Research Activity |
まず、1年目の計画であった有限状態機械及び私的観測における均衡の特徴付に関しては、検証データによる手がかりは乏しいため、数理的解析による特徴付けに専念する。 2年目の計画の内、(i)さらに一般化した繰り返しゲームの均衡解析のためのアルゴリズムの開発・ 検証にとりかかる。まずは既存の手法で扱える問題表現への変換から始め、より一般化された問題を取り扱えるアルゴリズムの開発・検証に移る。 (ii)また、均衡判定に特化したソルバの高速化にとりかかる。
|