研究課題/領域番号 |
23650075
|
研究種目 |
挑戦的萌芽研究
|
配分区分 | 基金 |
研究分野 |
知能情報学
|
研究機関 | 早稲田大学 |
研究代表者 |
菅原 俊治 早稲田大学, 理工学術院, 教授 (70396133)
|
連携研究者 |
栗原 聡 電気通信大学, 大学院・情報システム学研究科, 教授 (30397658)
廣津 登志夫 法政大学, 情報科学部, 教授 (10378268)
福田 健介 国立情報学研究所, アーキテクチャ科学研究系, 准教授 (90435503)
|
研究期間 (年度) |
2011 – 2013
|
研究課題ステータス |
完了 (2013年度)
|
配分額 *注記 |
3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
2013年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2012年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2011年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
|
キーワード | 社会規範 / 非均質エージェント / 分散処理 / 複雑ネットワーク / 強化学習 / マルチエージェントシステム / ノルム / 慣習 / 学習 / 安定性 / マルコフゲーム / 人工社会 / 大規模分散システム / 習慣 / 負荷分散 / 進化システム |
研究概要 |
本研究では競合状態の秩序をノルムとしてプログラム(エージェント)が習得する手法を提案し、その性質を調べた。このために競合状態を利得行列(戦略の選好と学習報酬)付きのマルコフゲームを用い、競合解消できない行動選択では競合が残り続ける定式化と、一時的には損しても効率的に競合から離脱するノルムを学習できるか調査した。その結果、(1)ノルムを獲得できるが、その質と安定性は利得行列に影響する、(2) 少数の異質のエージェントがノルムの学習自体は阻害しないものの、一度確立されたノルムを壊す現象がある、(3) エージェントにネットワーク構造を導入し、ノルムの変動と局所的なノルムの収束があることを確認した。
|