複数学習エージェントの相互作用による階層構造の発現に基づくロボットの行動生成
Project/Area Number |
14750184
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
Intelligent mechanics/Mechanical systems
|
Research Institution | Osaka University |
Principal Investigator |
高橋 泰岳 大阪大学, 大学院・工学研究科, 助手 (90324798)
|
Project Period (FY) |
2002 – 2003
|
Project Status |
Completed (Fiscal Year 2003)
|
Budget Amount *help |
¥3,500,000 (Direct Cost: ¥3,500,000)
Fiscal Year 2003: ¥1,300,000 (Direct Cost: ¥1,300,000)
Fiscal Year 2002: ¥2,200,000 (Direct Cost: ¥2,200,000)
|
Keywords | 強化学習 / 階層型学習機構 / 教示による行動学習 / 状態・行動空間の構成方法 / 行動理解 / 意図理解 |
Research Abstract |
本研究の目的は多種多様な論理センサ・アクチュエータを持つロボットが自身の経験を基に複数の学習エージェントの相互作用の中で階層的な世界感の自律的な構築とそれに基づく合目的行動の獲得を行う枠組を作ることにある.このため,最終年度である本年度は,前年度開発された学習エージェントの自律的生成アルゴリズムを用い,階層型学習機構における異なる状態・行動空間における学習結果の統合手法を開発し、より多くの論理センサ・アクチュエータを装備したロボットへの適用と検証を行った.以下が,主な結果である. 1.例示の理解による階層型学習機構を用いた段階的行動学習 コーチが目的を達成可能な行動系列を例示し,学習者がそれを自分なりに理解することで,これまでに獲得した学習器の有効性の判断や未学習であるサブタスクの発見及び新たな学習器の生成,階層構造の構築を自律的に行う手法を開発し,実験により確認した.この結果に関して下記の論文を投稿し,査読中である。 タイトル:例示の理解による階層型学習機構を用いた段階的行動学習 著者:疋田 晃一、高橋 泰岳、浅田 稔 投稿先:日本ロボット学会誌 2.異なる状態・行動空間を持つ学習器により獲得されたスキルの階層型学習機構による統合多様な論理センサ・アクチュエータを持つロボット状態・行動空間を部分空間に分割し,学習結果を上位層で統合することで効率的にロボットの行動を獲得する手法を開発し,実機での有効性を確認した. 3.全方位移動,全方位視覚,ピンボール型キック機構,タッチセンサ,赤外線距離センサなどの機能を持ったロボットを開発した.このロボットにより,開発を行ってきた手法の評価や,改良を進めていくことを現在進めている.
|
Report
(2 results)
Research Products
(4 results)