2014 Fiscal Year Research-status Report
Project/Area Number |
26730136
|
Research Institution | Osaka University |
Principal Investigator |
中村 泰 大阪大学, 基礎工学研究科, 准教授 (70403334)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 強化学習 / ガウス過程回帰 |
Outline of Annual Research Achievements |
平成26年度は 1. ロボットの作製, 2. ノンパラメトリックモデルを用いた制御法の開発, 3. LSH に基づく GP (ガウス過程回帰) 高速化アルゴリズムの開発を目標とした. ロボットの作製としては, 研究室で保有している空気圧駆動型の人間上肢型ロボットの各アクチュエータに空気圧センサー, モーションキャプチャシステム・加速度センサなどを加えて, ロボット自体の状態だけでなく外部とのインタラクションを計測できるロボットシステムを作製した. 外部の物体, 特にヒトとの抱擁などの物理的インタラクションにはロボットの姿勢やその動きだけでなく, その硬さの制御も重要な課題となるが, そのために必要な情報を含むと期待されるセンサの実装を行った。 また, ノンパラメトリックモデルを用いた制御法としては GP を用いたモーションプランニング (人工知能学会 2014 にて発表) の開発, 制御に必要なセンサを抽出する強化学習アルゴリズム (AROB にて出版) の開発を達成した. 前者は上記のロボットを動かすための基礎技術となるものであり, 多自由度ロボットに対する実用的な時間でのモーションプランニング法を開発した. 後者は上記のロボットシステムのように非常に多くのセンサを持つシステムから制御に必要なセンサ情報だけを抽出するメカニズムとなっており, 前者と組み合わせることでスケーラビリティのある制御法が確立できると期待される. GP の高速化に関しては不要なサンプルを間引くことで高速化をはかるスパース GP アルゴリズムの性能の評価を行っており, 我々が提案したハッシュキーを用いることで部分空間に分割することで高速化をはかる LSH-GP アルゴリズムとの組み合わせは今後の課題となっている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の目的は収集したデータセットを直接利用するノンパラメトリック法を基本とし, そのデータセットを操作することで学習を行い, 複雑な状況においても環境に対する先験的知識を利用しないロボットの制御法・学習法の開発を目指す. そのための課題として, 外界との物理的なインタラクションを行うことが可能なロボットの開発およびそのようなロボットシステムを制御する際に不可避な多自由度な制御対象に応用可能な制御手法の開発を行っている。 初年度は多数のセンサシステムを含むロボットシステムの作製, および, 基礎となるベイジアンノンパラメトリックモデルを利用した多自由度ロボットのためのモーションプランニングのためのロードマップ法を開発するとともに ,センサの重要性をタスクの達成度 (報酬) に基づき決定する学習法の開発も行った。これらの結果は人工知能学会での発表や論文誌 AROB での発表として結実している. また, 現在, ノンパラメトリックモデルの高速化に関してもスパース GP アルゴリズムに関する検討を開始すると共に, 人間上肢型ロボットを用いた外部物体との物理的インタラクションの実験も開始している. 多様な障害物などの存在する実空間で活動するロボットを開発するためには, 高速で複雑な対象を扱うノンパラメトリックモデルの開発や多数のセンサモダリティから必要な情報を抽出するアルゴリズムの開発だけでなく, それらの手法が外乱や障害物の存在する実空間で活動するロボットの制御に応用できることを示す必要があり, これらの課題は27年度以降に取り組む課題であるが, 研究は概ね順調に進展していると考えられる。
|
Strategy for Future Research Activity |
平成27年度以降の研究計画として, 多数のセンサ入力を持つロボットの制御・学習, および, 実世界での人との協調作業を計画している. 平成26年度に多数のセンサシステムを持つロボットシステムの作製を行っており, このロボットシステムを利用した制御法の開発に取り組む. 平成27年度は特に静物との物理的なインタラクションを行うことが必要なタスクについてのモーションプランニング・動作制御手法の開発に取り組む. ロボットシステム自体の開発としては, 現在用いている空気圧センサー, モーションキャプチャシステムや加速度センサなどで十分であるかは不明であるため, 異なるモダリティを計測するセンサ類の追加を検討する. 制御手法の開発としては, 強化学習法に基づいた制御に必要な情報を抽出するアルゴリズムとノンパラメトリックモデルを用いた動作制御法を組み合わせた多自由度システムに応用可能な制御手法を開発すると共に, データ数が増加した場合にも利用可能な高速なノンパラメトリックモデルの開発を目指す.
|
Causes of Carryover |
本研究では当初, 平面上で動作する肩関節および肘関節の二自由度からなるロボットを用いた研究を想定していたが, 最終目標である人間との物理的なインタラクションの実現を考慮し, 人間の構造を模倣したロボットを用いた研究を行っている. そのため, 当初に想定していたセンサーとは異なるセンサーを用いることとなった. 一方で, 研究室で保有しているセンサーシステムやソフトウェアが利用できた. そこで, 平成27年4月現在のプロトタイプとしてのロボットシステム作製には想定よりも費用をかけずに, 平成27年度以降に行う実際の実験を実行しながら様々なセンサについての検討を行うために次年度へと予算を残した. 一方で, 多数のセンサを用いるためのシステムは購入・設定済みであり, 様々なセンサを接続可能な状態となっている.
|
Expenditure Plan for Carryover Budget |
次年度使用額としては 26万円程度であり, 平成27年度に配分される費用と合わせて圧力センサや近接センサなどの新たな電子部品やそれらのセンサを取り付けるための機械部品として利用する. また, ロボットの実験において電子部品や機械部品は摩耗・破損などにより損耗する消耗品であり, ロボットの修理などにも利用する.
|