2012 年度実施状況報告書

協調学習アルゴリズムを用いた公正なシステム運用方式の獲得技術

研究課題

研究課題/領域番号	24560501
研究種目	基盤研究(C)
研究機関	大阪府立大学
研究代表者	松本啓之亮大阪府立大学, 工学(系)研究科(研究院), 教授 (90285304)
研究期間 (年度)	2012-04-01 – 2015-03-31
キーワード	機械学習 / 協調学習 / エージェント
研究概要	社会インフラを構成するシステムをその構成単位ごとに自律的に行動するマルチエージェントシステムとしてモデル化した．各エージェントの構造は知的判断部，基本機能部，ネットワーク通信関連部からなる．ネットワーク通信によりSOAP(Simple Object Access Protocol)プロトコルを介して結ばれるマルチエージェントシステムについて基本機能を定義し，その機能をモデル駆動開発手法を用いて一部実装した．定義された作業が協調をとりながら実行されることを確認するためプロトコルに準拠したテストを実施した．実フィールド環境では，不確実性や計測不能な未知のパラメータが存在するため，タスクの達成方法やゴールへの到達方法を事前にあらゆる場合を想定し，あらかじめ設定することは非常に困難となる．このため本研究では試行錯誤を通して環境に適応する学習制御の枠組みである協調学習を提案する．協調学習の適用例として追跡問題に強化学習を適用した．完全知覚学習と呼ばれる学習法で学習すると，エージェントの数が多くなるにつれて状態数の爆発が起こってしまうという問題がある．そこで，着目するエージェントの数を2 体に限定することにより，状態数を減らして強化学習の速度を速くした．しかし，それだけでは学習精度が悪くなってしまうので，ある程度学習したところで，学習速度が遅いが学習精度が良い完全知覚学習の学習器を利用するという“学習器の切り換え”という手法を用いることにより学習の速度を速く，かつ収束精度を良くすることができた．その際，一回の試行を通じて二つの強化学習の学習器を利用することになるので，メモリ量が膨大になることが考えられる．これについては，学習器の切り換えをする前後で学習器はメモリ上に2 体に着目して学習する学習器，または完全知覚学習の学習器のみにしてメモリ量の削減を実現し強化学習の効率化ができた．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由本研究のメインテーマの一つである協調学習アルゴリズムの中核部分について先行的に検討・実施し，実現の見通しが得られた．
今後の研究の推進方策	システムのモデル化と協調学習アルゴリズムの中核部分については見通しが得られたので，これらを基礎にしてプロトコルを通信するための分散型システムアーキテクチャの設計や各エージェントを効率よく協調させ公正なシステム運用方式を獲得するためのエージェントの知的判断部の実現を目指す．
次年度の研究費の使用計画	ネットワーク上で実用可能性を検証できる程度の規模をもつプロトタイプシステムを構築するため，クライアントマシンおよびネットワーク部品等を購入する．

研究成果
(6件)

すべて 2013 2012 その他

すべて雑誌論文 (2件) (うち査読あり 2件) 学会発表 (4件)

[雑誌論文] A Model-Driven Development Method for Management Information Systems2013
- 著者名/発表者名
  T. Mizuno, K. Matsumoto and N. Mori
- 雑誌名
  
  Electrical Engineering in Japan
  
  巻: 169 ページ: 1-6
- 査読あり
[雑誌論文] 追跡問題における状態数とメモリ量の削減に着目したQ 学習2012
- 著者名/発表者名
  伊木美太輔，松本啓之亮，森直樹
- 雑誌名
  
  システム制御情報学会論文誌
  
  巻: 25 ページ: 266-271
- 査読あり
[学会発表] 追跡問題におけるゴールデンクロスを利用した切り換え学習2012
- 著者名/発表者名
  伊木美太輔, 松本啓之亮, 森直樹
- 学会等名
  第55回自動制御連合講演会
- 発表場所
  京都大学吉田キャンパス
- 年月日
  20121117-20121118
[学会発表] A Cloud System for Supporting Web Service Integration Based on User Preferences2012
- 著者名/発表者名
  K. Matsumoto, T. Okabe, and N. Mori
- 学会等名
  International Conference on Mathematical Methods, Computational Techniques and Intelligent Systems
- 発表場所
  Porto, Portugal
- 年月日
  20120701-20120703
[学会発表] 追跡問題における状態数とメモリの削減に着目した強化学習2012
- 著者名/発表者名
  伊木美太輔, 松本啓之亮, 森直樹
- 学会等名
  第56回システム制御情報学会研究発表講演会
- 発表場所
  京都テルサ
- 年月日
  20120521-20120523
[学会発表] A Switching Q-Learning Approach Focusing on Partial States
- 著者名/発表者名
  K. Matsumoto, T. Ikimi, and N. Mori
- 学会等名
  2013 IFAC Conference on Manufacturing Modelling, Management, and Control
- 発表場所
  Saint Petersburg, Russia

2012 年度 実施状況報告書

協調学習アルゴリズムを用いた公正なシステム運用方式の獲得技術

研究代表者

松本 啓之亮 大阪府立大学, 工学(系)研究科(研究院), 教授 (90285304)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] A Model-Driven Development Method for Management Information Systems2013

著者名/発表者名

雑誌名

[雑誌論文] 追跡問題における状態数とメモリ量の削減に着目したQ 学習2012

著者名/発表者名

雑誌名

[学会発表] 追跡問題におけるゴールデンクロスを利用した切り換え学習2012

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] A Cloud System for Supporting Web Service Integration Based on User Preferences2012

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 追跡問題における状態数とメモリの削減に着目した強化学習2012

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] A Switching Q-Learning Approach Focusing on Partial States

著者名/発表者名

学会等名

発表場所

2012 年度実施状況報告書

松本啓之亮大阪府立大学, 工学(系)研究科(研究院), 教授 (90285304)