2011 年度実績報告書

マルチエージェントの学習過程に注目した系安定化・全体最適化に関する研究

研究課題

研究課題/領域番号	21500153
研究機関	独立行政法人産業技術総合研究所
研究代表者	野田五十樹独立行政法人産業技術総合研究所, サービス工学研究センター, 研究チーム長 (40357744)
研究分担者	山下倫央独立行政法人産業技術総合研究所, サービス工学研究センター, 研究員 (50415759)
キーワード	マルチエージェント / 強化学習 / デマンドパスシミュレーション / 学習パラメータ
研究概要	本年度は、これまで得た結果を元に、動的な環境におけるマルチエージェントの群としての挙動の分析を進め、系の制御を可能とする情報の収集・配信方法について検討を行なった。まず、これまで進めてきた再帰的ステップサイズパラメータ調整法(RASP)を株取引市場に適用し、系全体の特徴をパラメータ化してエージェントの行動の制御に用いることを試みた。ここでは株価の変化を環境からの報酬と扱い、RASPを用いて系の特徴を抽出し、株の売り買いにどの程度適用可能かを検証した。また、平行して、エージェント行動を制御する温度パラメータについて、エージェントが学習を進める系全体の変化の大きさとの関係を数値解析的に分析し、その結果に従ってパラメータを制御し、系全体の状態を表す情報を獲得する方法を構築した。動的環境下におけるエージェントの行動学習では、行動選択の方針、特にExplorationとExploitationの割合(以下E-E ratioと呼ぶ)を制御する温度パラメータをどう決めるのかが重要な問題となる。特にマルチエージェント環境下では各エージェントの行動選択が他エージェントの学習環境に直接影響するため、E-E ratioは十分に注意して選ぶ必要がある。それに対し、二人のエージェントが強化学習を行う場合のExplorationとExploitationの割合(E-E ratio)と行動選択が正解となる確率の関係を調べ、正解確率を最大化するE-E ratioを求める方法を提案した。この方法では、変化する利得行列に追従するためのExplorationの確保と、相互の学習に与える影響の低減のためのExploitationのトレードオフを、行動選択の正解確率最大化という確率で解く方法となっている。この最大化を求めるにあたっては、エージェント相互の行動選択の対称性を仮定しており、エージェントの社会性につながる前提を用いている。これにより、突発的に変化する環境においても、温度パラメータを適切に制御する方法を確立することができ、学習および系全体を安定させる枠組みを構築することができた。さらには、震災における災害救助や避難行動および情報配信の調査を行ない、情報がエージェント群に与える影響についてのデータの蓄積を行なった。

研究成果
(5件)

すべて 2012 2011

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (4件)

[雑誌論文] Adaption of Stepsize Parameter Using Newton's Method2011
- 著者名/発表者名
  Itsuki Noda
- 雑誌名
  
  AGENTS IN PRINCIPLE, AGENTS IN PRACTICE
  
  巻: Vol.7047 ページ: 349-360
- DOI
  DOI:10.1007/978-3-642-25044-6_28
- 査読あり
[学会発表] 災害救助マルチエージェントシミュレーションの可能性2012
- 著者名/発表者名
  野田五十樹
- 学会等名
  FUN-AI 2012
- 発表場所
  北海道グリーンピア大沼
- 年月日
  2012-03-03
[学会発表] 動的環境におけるExploitation/Exploration比率の制御2011
- 著者名/発表者名
  野田五十樹
- 学会等名
  JAWS2011
- 発表場所
  静岡県熱海後楽園ホテル
- 年月日
  2011-10-27
[学会発表] 再帰的ステップサイズパラメータ調整法による株取引におけるボリュームカーブの推定2011
- 著者名/発表者名
  松井宏樹, 林慶樹, 野田五十樹
- 学会等名
  人工知能学会
- 発表場所
  岩手県いわて県民情報交流センター
- 年月日
  2011-06-02
[学会発表] マルチエージェント学習下における温度パラメータの調節手法2011
- 著者名/発表者名
  野田五十樹, Kim Hyun-Tae
- 学会等名
  人工知能学会
- 発表場所
  岩手県いわて県民情報交流センター
- 年月日
  2011-06-01

2011 年度 実績報告書

マルチエージェントの学習過程に注目した系安定化・全体最適化に関する研究

研究代表者

野田 五十樹 独立行政法人産業技術総合研究所, サービス工学研究センター, 研究チーム長 (40357744)

研究成果

[雑誌論文] Adaption of Stepsize Parameter Using Newton's Method2011

著者名/発表者名

雑誌名

DOI

[学会発表] 災害救助マルチエージェントシミュレーションの可能性2012

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 動的環境におけるExploitation/Exploration比率の制御2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 再帰的ステップサイズパラメータ調整法による株取引におけるボリュームカーブの推定2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] マルチエージェント学習下における温度パラメータの調節手法2011

著者名/発表者名

学会等名

発表場所

年月日

2011 年度実績報告書

野田五十樹独立行政法人産業技術総合研究所, サービス工学研究センター, 研究チーム長 (40357744)