研究概要 |
未知環境における自律型ロボットに対し,状態推定および環境推定手法を構築した.未知環境において作業目標を達成するために,オペレータとの協調的な制御が不可欠であることから,オペレータと自律ロボット間で制御目的を共有するようなシステムを提案した. 未知環境においてロボットが作業目的を達成するには,目的達成に影響する不確かさを推定するような行動(本申請書では探索行動と呼ぶ)の選択が必要である.本研究はロボットの環境適応性の実現を目的とし,探索行動と目的達成行動とのトレードオフ関係に着目し,不確かさに依存した行動選択の設計原理を導出した.探索行動と目的達成行動とのトレードオフ問題は,強化学習における探査:exploration行動と,知識利用:exploitation行動とのトレードオフ問題や,多目的最適化問題と同様に,各目的への重み付けをいかに設計するかという重み付け設計問題に帰着できる.そこで,探索行動と目的達成行動とを不確かさをパラメータとする多目的最適化問題として定式化し,不確かさに依存した行動設計法を構築した. 環境に不確かさがある状況において確実に作業目的を達成するシステム原理を解明するために,題材として未知環境におけるロボットの目的地への移動問題を取り上げた.環境と直接相互作用する移動ロボットが直接観測できる情報は局所的であるが解像度が高い.しかし,環境の不確かさの影響を受けることが問題である.よって,環境の影響を受けない情報基準が不可欠である.しかし,環境の影響を受けないためには情報基準は環境外部にある必要があり,このため一般に取得できる情報は解像度が低く,あいまいさを含んでしまう.そこで本研究では環境の不確かさの影響を受けない情報を提供する観測ロボットを考え,環境中の移動ロボットと協調的に環境の不確かさを推定することにより,目的地への到達を実現するシステムを構築した.
|