2011 Fiscal Year Research-status Report
非均質マルチエージェントシステムの競合状況におけるノルムの獲得と維持に関する研究
Project/Area Number |
23650075
|
Research Institution | Waseda University |
Principal Investigator |
菅原 俊治 早稲田大学, 理工学術院, 教授 (70396133)
|
Project Period (FY) |
2011-04-28 – 2014-03-31
|
Keywords | ノルム / 習慣 / 負荷分散 / 強化学習 / 大規模分散システム / 進化システム / マルチエージェントシステム / マルコフゲーム |
Research Abstract |
本研究は、競合する社会における秩序生成をノルム(norm)という形で各プログラム(エージェント)が習得する手法を提案し、その性質を解明することが目的である。本研究により、たとえば、クラウドやサービスコンピューティングにおいて、(1) 要求されるサービス要素を適切に構成し実行するための優先順位を、エージェント群(社会)が自然発生的に決め、社会の効率化を自ら学習する、(2) 得られたノルムを維持あるいは改変する能力を持つこと、などを狙う。 本年度は初年度であり、まず学習のモデルと方式について基本検討を行った。その結果、確率ゲームと進化ゲームを融合したモデルを考案した。各エージェントの個々の競合は確率ゲーム(あるいはマルコフゲーム)として表現する。これをエージェントが進化ゲームのように繰り返すが、競合は常に不特定の相手との間で起こるという点で違いがある。これは、動的にサービスを構成するサービス指向モデルでは、サービス要素を動的に組み立てるものの、常に同じ相手と協力するわけではないことを表現している。 また、このモデルに基づいて上記の状況を自動車エージェントの判断におけるゲームとして考案した。その例にもとづいてシミュレーションを作成し、実験を行った。同じ戦略(利得行列)を持つ均一エージェントが二つのグループに分かれ、競合し、どちらかのグループ全員が直近の損がある(たとえば、所要時間がかかるなど)ものの社会的には効率的な結果を導き、その影響で最終的には直近で損をしたエージェント達にも利益のある行動選択を社会規則としてのノルムの獲得(学習)できる可能性を示した。また、その学習したノルムを学習しながら使い続けたときのきその規則の安定性についても調査した。この結果、学習はできるもののその安定性には、エージェントの戦略によって大きな違いがあることが分かった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は、震災による影響で交付が遅れるなど当初の予定を修正する必要はあったが、その後はほぼ予定通りに進んでいる。シミュレーション環境の実装はほぼ予定通りであり、実験も着手している。モデルの検討についても、前にも述べたように、いくつかの方式を検討し、確率ゲームとた進化ゲームを融合したモデルに的を絞っている。投稿についても国際会議を中心に行っている。
|
Strategy for Future Research Activity |
本研究では、競合する社会における秩序生成をノルム(norm)あるいはさらに強い規定となる習慣(convention)という形で各プログラム(エージェント)が習得する手法を提案し、社会(マルチエージェントシステム全体)の効率を上げること、および習得したノルムの質や安定性を解明することが目的である。 本年度は、均一エージェントを主に想定した実験を行った。これにより均一エージェントの場合でも、学習の可能性や収束したノルムの質に差があることが分かった。特に、自分と相手の利益を同様に考える寛大なエージェントの社会では、(競合は少なくなるかもしれないが)効率的なノルムを獲得できないという結果を得た。さらに継続的に使い続けることで、安定的でなくなることも分かった。 次年度は異種エージェント(異なる戦略=異なる利得行列)を持つエージェントが混ざったときに得られるノルムや習慣規則の学習可能性と安定性について調査・検証する。特に得られたノルムの質への影響、あるいはエージェント全体としてのノルムを維持しようとする頑健さ(安定性)を中心に、その特性を調査する。このために、本年度作成したシミュレーションを拡張する作業を前半に行う。合わせて、昨年度の結果から、安定さを壊すエージェントを解析する。後半に安定さを壊すエージェントの数と多数のエージェントの質を調査し、安定性を崩されにくい戦略を求める。このために、前半のシミュレーションを使用した実験を行う。結果を資料としてまとめ、国内会議および国際会議への投稿をめざす。
|
Expenditure Plans for the Next FY Research Funding |
主に以下の項目の使用を計画している。 (1) 研究用(シミュレーションデータ処理、資料作成)ソフトウェアの購入(備品)、 (2) 国際会議(研究発表および調査)出張旅費、 (3) 国際会議参加費、(4) 国内会議出張旅費、 (4) 英文校閲費(新規投稿用、2件程度)、(5) 実験補助者なお、実験補助は、シミュレーションデータの収集と整理を予定する。
|
Research Products
(10 results)