Research Abstract |
本年度は,人間の情報処理系において実現されている「注意」,「反射」,「発達」の統合された行動システムに対するモデルの中で,特に「注意誘導機構」,「反射統合系」,「学習反応系」に着目して研究を進めた.本年度の研究の実績の詳細を以下に示す. ○人間における反射・学習系の機能的整理に基づくヒューマノイドの全体統合モデルの設計 ○全身感覚情報系の統合に基づく注意誘導機構の実現 ○注意誘導機構に基づく反射行動統合系の動的調整機構 ○注意誘導機構に基づく新たな反射行動の獲得 人間における反射・学習系を機能的に整理し,元々ロボットが行おうとしていた合目標的行動を反射系,学習系によって行動修正する統合モデルを設計した.その際に,刺激の発生に応じて自動的に処理される注意過程によって,そのような行動修正機能の修正の程度を調節可能にした.この時,反射機能は刺激・動作の複数の型を予め人間が並列モジュールとして実装して与え,その出力の強さ及びタイミングを調節するようにした.また,学習系は自らの動作の結果に基づき学習を進める強化学習を導入し,注意機構により計算される状態量を利用して状態行為空間及び選択した行為の評価のための報酬関数を構築した.そして,全体の構造として,そのような環境からの刺激によって生じる自動的な注意に基づく行動修正機能を,合目標的行動を行うプロセスのバックグラウンドで並列に実行するよう設計することで,ヒューマノイドの合目標的行動の記述を簡易化するとともに,これまでの行動プログラミング資産を有効利用できる形にした.以上の注意・反射・発達の統合モデルに関して,超多自由度ヒューマノイドKenta, Kenji及びヒューマノイドプラットホームHRP2の異なるハードウェア,ソフトウェア構成のヒューマノイドに適用した行動統合実験を行い,その有効性を確認した.そして,これらの成果を博士論文としてまとめた.
|