研究概要 |
(1)推移確率未知なマルコフ決定過程に対する分散学習アルゴリズム(オートマン)の構成法を与え,シミュレーションによってその有効性を確認し,本分散学習オートマンとWatkinsによるQ-Learingとを数値実験により種々比較検討した。 (2)移動ロボットの開発を支援するオブジェクト指向に基づくソフトウェアシステムを完成し、そのシステムを用いて、障害物回避問題への学習的アプローチを試みた。すなわち、Borensteinらによる障害物回避アルゴリズムVHF法における諸パラメータを学習オートマトンによって自動調整する手法を開発し、シミュレーションと実機による動作実験を行い、その有効性を確認した。 (3)未知環境で動作する移動ロボットの行動の自律的生成問題に対し、分散学習オートマトンを適用する方法を開発し、シミュレーションによる実験的検討を行った。すなわち、その上部にフォトセンサを想定した移動ロボットに対し、光源に向かう行動の獲得を分散学習によって行う方法を提案し、その有効性をシミュレーション実験によって検証した。 (4)上記の研究では、マルコフモデルが予め定義されていることを前提としている。しかし、現実の問題では、そのようなモデルをオンラインで同定する必要がある。そこで、ケストラ-の提唱によるホロンの考えに基づく、大規模非線形システムの自律分散的な新しい同定アルゴリズム(ホロンネットワーク)を提案した。すなわち、ホロンネットワークの構造パラメータを改変する秩序化方式とよぶ新しい学習アルゴリズムを提案した。このホロン・ネットワークと学習オートマントとを統合した、より高度な分散学習機構を実現することが今後の課題である。
|