2012 Fiscal Year Research-status Report
協調学習アルゴリズムを用いた公正なシステム運用方式の獲得技術
Project/Area Number |
24560501
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Osaka Prefecture University |
Principal Investigator |
松本 啓之亮 大阪府立大学, 工学(系)研究科(研究院), 教授 (90285304)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 機械学習 / 協調学習 / エージェント |
Research Abstract |
社会インフラを構成するシステムをその構成単位ごとに自律的に行動するマルチエージェントシステムとしてモデル化した.各エージェントの構造は知的判断部,基本機能部,ネットワーク通信関連部からなる. ネットワーク通信によりSOAP(Simple Object Access Protocol)プロトコルを介して結ばれるマルチエージェントシステムについて基本機能を定義し,その機能をモデル駆動開発手法を用いて一部実装した.定義された作業が協調をとりながら実行されることを確認するためプロトコルに準拠したテストを実施した.実フィールド環境では,不確実性や計測不能な未知のパラメータが存在するため,タスクの達成方法やゴールへの到達方法を事前にあらゆる場合を想定し,あらかじめ設定することは非常に困難となる.このため本研究では試行錯誤を通して環境に適応する学習制御の枠組みである協調学習を提案する. 協調学習の適用例として追跡問題に強化学習を適用した.完全知覚学習と呼ばれる学習法で学習すると,エージェントの数が多くなるにつれて状態数の爆発が起こってしまうという問題がある.そこで,着目するエージェントの数を2 体に限定することにより,状態数を減らして強化学習の速度を速くした.しかし,それだけでは学習精度が悪くなってしまうので,ある程度学習したところで,学習速度が遅いが学習精度が良い完全知覚学習の学習器を利用するという“学習器の切り換え”という手法を用いることにより学習の速度を速く,かつ収束精度を良くすることができた.その際,一回の試行を通じて二つの強化学習の学習器を利用することになるので,メモリ量が膨大になることが考えられる.これについては,学習器の切り換えをする前後で学習器はメモリ上に2 体に着目して学習する学習器,または完全知覚学習の学習器のみにしてメモリ量の削減を実現し強化学習の効率化ができた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究のメインテーマの一つである協調学習アルゴリズムの中核部分について先行的に検討・実施し,実現の見通しが得られた.
|
Strategy for Future Research Activity |
システムのモデル化と協調学習アルゴリズムの中核部分については見通しが得られたので,これらを基礎にしてプロトコルを通信するための分散型システムアーキテクチャの設計や各エージェントを効率よく協調させ公正なシステム運用方式を獲得するためのエージェントの知的判断部の実現を目指す.
|
Expenditure Plans for the Next FY Research Funding |
ネットワーク上で実用可能性を検証できる程度の規模をもつプロトタイプシステムを構築するため,クライアントマシンおよびネットワーク部品等を購入する.
|
Research Products
(6 results)