研究課題/領域番号 |
18KT0063
|
研究機関 | 早稲田大学 |
研究代表者 |
亀崎 允啓 早稲田大学, 理工学術院総合研究所(理工学研究所), 主任研究員(研究院准教授) (30468863)
|
研究期間 (年度) |
2018-07-18 – 2021-03-31
|
キーワード | 能動的情報探索 / 効率的動作探索 / 災害対応ロボット / 実空間 / 仮想空間 |
研究実績の概要 |
未知の環境であっても柔軟かつロバストに動作できる自律型ロボットには,与えられたタスクの成否を判断でき,否と判断された際の代替案を模索できる機能が必要である.災害対応作業には失敗が許されないことから,危険性や時間を要する実空間ではなく,仮想空間での試行錯誤に基づく動作獲得が効果的と考えられる.本研究では,実環境での試行錯誤が難しく,対象の物性が未知の環境において,実空間での能動的情報取得と仮想空間での動作学習機能を核とした「自律移動ロボットの適応性強化」をねらう. 2年度は,環境適応性強化システムのうち,(3)動作学習,および(4)動作実行モジュールを開発した.(3)では,効率的な多自由度ロボットの動作学習手法,学習後の動作評価を明示的に出力可能な動作探索手法が求められる.そこで,遺伝的アルゴリズム(GA)を用いた動作学習手法を開発した.具体的には,作業ごとに用意されている基本動作およびそれまでの学習動作から初期集団を形成し,各個体の信頼度を適合度として算出する.そして,その結果から個体をエリート選択とルーレット選択を用いて選択し,交叉・突然変異から次世代の個体を生成する.これを適合度が基準値以上になるまで行う.基本動作と環境情報を入力として,学習後の動作とその信頼度を出力する.(4)において,仮想空間での確認動作を実空間で動作させて確実にタスク完遂するには,実空間での機体の位置・姿勢が,仮想空間で動作させた場合と大きく差異がないことが重要である.そこで,動作実行中に機体の位置や姿勢をモニタリングすることにより,作業に異常がないかを常に監視する.動作に異常が確認された場合,安全な位置まで後退し,操作者にその状態を提示する.災害現場を模した環境で,未知の条件を含む段差登りを実施した結果,仮想空間での動作探索により効率的に動作が学習され,作業が遂行可能になることが確認された.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2年度は,環境適応性強化システムのうち,(3)動作学習,および(4)動作実行モジュールの開発に取り組んだ.本年度の成果は,災害現場を模した環境で,未知の条件を含む段差登りを実施した結果,仮想空間での動作探索により効率的に動作が学習され,作業が遂行可能になることが確認されたことである.動作学習のアルゴリズムには,一刻も早くタスク遂行に移れるように「効率的に多自由度ロボットの動作学習が行えること」,そして,制御アルゴリズムの解釈および再利用を可能とする「学習後の動作の評価が明示的に出力できること」が求められる.本研究では,これらの点を十分に考慮し,そのプロトタイプとして遺伝的アルゴリズム(GA)を用いた.また,効果的に学習を行うため,動作をフェーズに分け,問題が生じたフェーズのみ学習を行った点もポイントである.学習パラメータとして,各関節の目標関節角と角速度,クローラの基本速度,フェーズ切り替え条件などを試行錯誤的に採用した.また,作業中に異常が生じていないかを常に監視するため,動作実行中に機体の位置や姿勢をモニタリングするシステムも開発した. ロボットが有する基本動作とロボットが取得した環境情報を入力として,GAを用いた動作学習を行い,昨年度に提案した信頼度が一定値以上の動作を出力する一連のシステム構築ができたことも重要な成果である.これらのことから,実空間での能動的情報取得と仮想空間での動作学習機能を核とした基盤構築による「自律移動ロボットの適応性強化」のための,基本モジュールは順次構築できており,また,その有用性を実験から確認することができた.また,3年度で取り組む各機能モジュールのブラッシュアップおよび統合基盤システム構築に移行できる有用な成果を得ることができた.以上から,当研究課題は順調に進捗しているといえる.
|
今後の研究の推進方策 |
3年度は,環境適応性強化システムにおける(1)~(4)の各機能モジュールをブラッシュアップしながら,基盤システムとして統合を図る.また,より実際的な環境でのシステム評価を行う予定である.(1)環境情報取得および(2)動作確認モジュールに関しては,より複雑な環境下での推定精度と高効率化の両立を図る.そのためには,押し込み量や動作速度,接触箇所等を的確に判断する機能が必要となる.環境情報取得機能と連携した物体性状情報探索計画アルゴリズムの開発を行う.(3)動作学習に関しては,高効率探索のためタスクを分割して並列学習を行う階層化を行う予定である.災害現場のように不確実性のある環境での高精度な動作学習には,探索空間の大きさ(次元数と時間軸方向)が課題となってくる.高速化という観点では,学習の経験を他タスクの学習に再利用できること,さらに,学習結果を制御モデルに反映させられることが重要になってくる.部分観測マルコフ決定過程や転移学習の知見を応用する.(4)動作実行モジュールに関しては,より安全な作業実現のために,タスク遂行中における「推定値と実測値」の誤差をモニタリングし,必要に応じて適切に動作調整を行う反射系のフィードバック系の構築を行う. 実環境での試行錯誤が難しく,対象の物性が未知の作業環境において,実空間での能動的情報探索と仮想空間での効率的動作探索を核とした「自律型移動ロボットの適応性強化」に貢献することが本研究課題のねらいである.「自律システム自身が,タスクの成否をいかにして推定するか,そして,タスク成功のために短期間でどのように動作調整していくか,また,これらを達成するために実空間と仮想空間をどのようにうまく使い分けるか」という本研究課題の核心をなす学術的な「問い」について答えをだす.
|
次年度使用額が生じた理由 |
ロボット整備用電装部品を計上していたが,当該年度はそれらの整備を必要とする実験を行わないことになったため,物品費およびその加工費の支出はなかった.最終年度には,当該年度で行わなかった実験を行うため,これらの整備に必要な支出を行う.また,成果発表等による旅費の支出もなかったが,これらも最終年度にまとめて行う予定である.次年度使用額が生じることによる計画への支障はない.
|