1997 Fiscal Year Annual Research Report
分散協調型強化学習によるマルチエージェントシステムの研究
Project/Area Number |
09780360
|
Research Institution | Kanazawa Institute of Technology |
Principal Investigator |
阿部 倫之 金沢工業大学, 工学部, 助教授 (60231966)
|
Keywords | マルチエージェント / 強化学習 / 分散協調 / QoS制御 / ルールベース / 推論 |
Research Abstract |
本研究課題では、分散協調型強化学習法を用いたマルチエージェントシステムの実現とその評価を目的として、平成9年度は、分散協調型強化学習モデルの構築とこのモデルに基づく知的マルチエージェントプラットフォームの実装および評価用動画マルチサーバシステムの実装に関する研究を行った。 1.分散協調型強化学習モデルの構築 マルチエージェント系では、学習途中において環境が変化するため、学習途中においても一定の報酬獲得が期待できる学習法(経験強化型学習法)をベースにする必要がある。そこで、代表的な経験強化型学習法であるprofit sharing法とbucket brigade法をベースとし、これに協調能力を付加した分散協調型強化学習モデルについて検討した。エージェント間の協調は、協調相手の「ルールの強度」と「発火ルール」を共有することによって実現し、強化学習の枠組み内での協調メカニズムの実現を図った。この結果、前者の共有をバックグラウンドで定期的に実施することによって、相手の行動意図を予測するように動作シナリオを洗練することが可能となった。また、後者では、エージェント間で競合状態が発生したときの排他制御を実現しており、その結果を報酬として互いの動作シナリオに反映することで協調意図の洗練が可能となった。 2.知的マルチエージェントプラットフォームの実装 分散協調型強化学習モデルに基づくマルチエージェントプラットフォームをCLOSを用いてSUNワークステーション上に実装した。システムは、ルールベースの推論エンジン、強化学習ベースの適応学習エンジン、適応協調エンジンから成り、エージェントの動作シナリオを解釈実行する。このプラットフォームにおいて複数のエージェントの動作実験を行い、協調動作を含む基本的な学習能力を確認した。 3.動画マルチサーバシステムの実装 評価用の動画マルチサーバシステムとして、XVIDEOベースのJPEG圧縮動画配送システムを構成し、フレームレートや圧縮率などのQoS制御に関する基礎的実験と評価を実施した。今後、エージェントシステムとの連動方式について検討する予定である。
|
Research Products
(1 results)