2015 Fiscal Year Research-status Report
Project/Area Number |
26730136
|
Research Institution | Osaka University |
Principal Investigator |
中村 泰 大阪大学, 基礎工学研究科, 招へい准教授 (70403334)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | ガウス過程回帰 / 強化学習 / 動作計画 |
Outline of Annual Research Achievements |
本研究課題では,環境についての知識を前提とすることができない実世界で活動するロボットの開発を目的としている.そこで,近年,様々な実問題に応用されてきているノンパラメトリック法を利用した外界との接触などのインタラクションが避けられない複雑な環境でも活動できるロボットのための制御法の開発を目指している. 平成27年度は平成26年度に開発した高速なノンパラメトリックモデルである LSH-GPR をベースとした制御法の実ロボットへの応用に取り組んだ.単純な構造を持つロボット (シミュレーション) を制御対象としてオンライン動作計画法の開発を行うとともに,モデルの与えられていない静的な物体との物理的なインタラクションが避けられない状況での動作計画に必要な接触時にロボットの手先に加わる力に対する予測モデルの構築を行った.さらに,ダイナミクスが前もって与えられない状況の下で適用可能なロボット制御法としてモーションプランニング手法の開発を行い,空気圧駆動型の人間上肢型ロボットへの対する応用に取り組んだ. また,実環境での人間とのインタラクションを実現するロボットの実現を目指し,近年,自然画像や音声認識など実環境で容易に計測可能なセンサデータに対して非常に高い識別率を実現している手法であるディープラーニングの利用に関する検討を行った.ロボット自身に埋め込まれた視覚センサのみを用いた認識より,人とのコミュニケーション動作の学習を行うロボットの開発に着手している.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
空気圧駆動型の人間上肢型ロボットの制御においては,我々の開発した LSH-GPR により,制御対象のモデル化を明には行わず,試行錯誤的に収集したデータからロボットの動作に対する予測モデルを用い,ロードマップ法に基づく制御手法を開発した.本手法では,LSH-GPR がベイジアンノンパラメトリック法の一種であることから,予測値の信頼性を推定することができることを利用し,予測の信頼性に基づく制御手法を開発することができた.すなわち,過去の経験に基づき再現可能性が高いと推定される動作を計画することが可能となり,少ないデータからでもゴールに到達する可能性を考慮した信頼性の高い動作計画が実現出来る.本手法を人間上肢型ロボットのリーチングタスクに応用し,複雑な構造を持つロボットの制御にも適用可能なことを示した. ロードマップ法は実際にロボットを稼働する前に動作を計画するものであり,予測モデルの推定誤差や確率的な振る舞いによって,実際の動作が計画通りに実現するとは限らない.そこで,オンラインで誤差を補正する枠組みとしてオンライン動作計画法の開発にも取り組んだ.オンライン動作計画においては精度だけではなく制御周期に合わせた高速な計算速度も要求される. 単純な構造を持つロボット (シミュレーション) への適用の結果,精度の面では我々の開発した LSH-GPR は優れているが,計算量が今後の課題となっている.また,物理的なインタラクションが避けられない実環境で活動するロボットの実現に向けて,接触において発生する力を予測するモデルの開発にも取り組んだ.我々の開発した LSH-GPR は精度や計算量において十分な能力を持っていることを示した.これらの技術をまとめることで,実環境において活動するロボットに対する制御法の開発が期待できる.
|
Strategy for Future Research Activity |
平成27年度までに,i) 入力されるセンサ情報に対して重み付けを行うことで必要な情報だけを使った方策関数を構築する強化学習法,ii) 複雑な入出力関係をモデル化可能なガウス過程回帰 (GPR) を桁違いに高速化するLSH-GPR を用いたモーションプランニング手法,iii) LSH-GPR を利用することで精度と速度を両立させたロボットと外部の物体との接触によって生じる力に対する予測手法,を開発してきた.さらに,現在,実空間において人との物理的なインタラクションの学習を行うロボットの開発にも取り組んでいる. 平成28年はこれらの個々の要素を取りまとめることで,実環境では避けることができない複雑な状況においても適用可能なロボットの制御法の開発に取り組む.さらに,近年盛んに注目されているディープラーニングの応用を視野に入れ,視覚センサの情報 (すなわち,画像) を直接用いて人間とのインタラクションを行うロボットの実験にも取り組んでおり,これらの技術を組み合わせることでロボットが試行錯誤する中から自律的に行動決定のための情報を抽出し,適切なコミュニケーション行動を学習する枠組みを開発する.
|
Causes of Carryover |
実験を行うにあたって,ロボットに使用しているセンサや部品などが故障するなどして消耗するため,前もって全ての予算を使って準備するのではなく,都度補充するようにしている.そのため,センサや部品といった機械部品,電子部品の消耗品を購入するために確保していた予算の一部を次年度に持ち越すこととなった.
|
Expenditure Plan for Carryover Budget |
当初の計画通り,実験に用いる機械部品・電子部品の購入に利用する予定である.
|