分散協調型強化学習によるマルチエージェントシステムの研究

Research Project

Project/Area Number	09780360
Research Category	Grant-in-Aid for Encouragement of Young Scientists (A)
Allocation Type	Single-year Grants
Research Field	Intelligent informatics
Research Institution	Kanazawa Institute of Technology
Principal Investigator	阿部倫之金沢工業大学, 工学部, 助教授 (60231966)
Project Period (FY)	1997 – 1998
Project Status	Completed (Fiscal Year 1998)
Budget Amount *help	¥2,400,000 (Direct Cost: ¥2,400,000) Fiscal Year 1998: ¥700,000 (Direct Cost: ¥700,000) Fiscal Year 1997: ¥1,700,000 (Direct Cost: ¥1,700,000)
Keywords	マルチエージェント / 強化学習 / 分散協調 / QOS制御 / ビデオ / QoS制御 / ルールベース / 推論
Research Abstract	本研究課題では、分散協調型強化学習法を用いたマルチェージェントシステムの実現とその評価を目的として、平成10年度は、エージェントの知識の実装と学習能力の評価を行った。 1. エージェントの知識の実ネットワーク上で動画のオンデマンドサービスを提供するマルチサーバシステムを取り上げ、これを適応的に制御するためのエージェントを実装した。エージェントは、分散協調型強化学習を用いた知的マルチエージェントプラットフォーム(平成9年度に作成)を用いて作成している。各エージェントはそれぞれ1つのサーバを管理し、必要に応じて「リクエスト・パス」や「サービス品質の変更」を行う。各エージェントの動作シナリオは約257個のルールから成り、単位時間あたりのサーバ処理負荷(トランザクション量)に応じて必要な行為を決定する。この行為が事前に決定できない場合は、想定される行為毎にルールを作成し、学習によって必要な行為を決定するように動作シナリオを作成した。 2. エージェントの学習能力の評価ビデオ配送の実機システムを用いて、M-JPEGフレームの転送時間と処理時間等を測定し、このパラメータを用いて動画のマルチサーバ実験環境を実装した。この環境とマルチエージェントシステムをSUNワークステーション(Ultra-1)上で連動させ、エージェントの学習能力について基礎的実験を行った。トレーニング1期間を8400秒とし、15秒間隔で各サーバの状態(リクエスト平均待ち時間や滞留トランザクション量など)をエージェントに送った。実験ではトレーニングを50期間行い、各トレーニング期間における平均リクエスト待ち時間を算出した。その結果、50期間目において、リクエスト平均待ち時間が初期の約3分の1まで減少しており、学習の収束性とその有効性を確認した。 3. まとめ本研究課題により、サーバが適切な負荷バランスを獲得するようにエージェントの学習が収束することを確認できた。エージェントの予測能力やネットワーク適用事例の拡張等については今後の課題である。