2002 Fiscal Year Annual Research Report
複数学習エージェントの相互作用による階層構造の発現に基づくロボットの行動生成
Project/Area Number |
14750184
|
Research Institution | Osaka University |
Principal Investigator |
高橋 泰岳 大阪大学, 大学院・工学研究科, 助手 (90324798)
|
Keywords | 強化学習 / 階層型学習機構 / 教示による行動学習 / 状態・行動空間の構成方法 / 行動理解 / 意図理解 |
Research Abstract |
本研究の目的は多種多様な論理センサ・アクチュエータを持つロボットが自身の経験を基に複数の学習エージェントの相互作用の中で階層的な世界感の自律的な構築とそれに基づく合目的行動の獲得を行う枠組を作ることにある.このため,初年度である本年度は,学習エージェントの自律的生成アルゴリズムの開発,シミュレーションによる確認,階層型学習機構における異なる状態・行動空間における学習結果の統合手法の開発,実機による確認,またより多くの論理センサ・アクチュエータを装備したロボットの開発を行った.以下が,主な結果である. 1.例示の理解による階層型学習機構を用いた段階的行動学習 コーチが目的を達成可能な行動系列を例示し,学習者がそれを自分なりに理解することで,これまでに獲得した学習器の有効性の判断や未学習であるサブタスクの発見及び新たな学習器の生成,階層構造の構築を自律的に行なう手法を開発し,実験により確認した.この結果に関して論文を準備中である. 2.異なる状態・行動空間を持つ学習器により獲得されたスキルの階層型学習機構による統合 多様な論理センサ・アクチュエータを持つロボット状態・行動空間を部分空間に分割し,学習結果を上位層で統合することで効率的にロボットの行動を獲得する手法を開発し,実機での有効性を確認した.この結果に関して現在論文を準備中である. 3.全方位移動,全方位視覚,ピンボール型キック機構,タッチセンサ,赤外線距離センサなどの機能を持ったロボットを開発した.このロボットにより,開発を行ってきた手法の評価や,改良を進めていくことが期待できる.
|
Research Products
(1 results)