研究実績の概要 |
多目的環境下における均衡的行動の決定手法を目指し,本年度では(1)タスクの追加・削除・効率的な追加タスクの学習手法についての提案および(2)深層強化学習の実装・実験を行い,(3)実機実験に向けた実ロボットの検討を行った. (1)ではタスクに階層構造を持たせ,既存のタスクを組み合わせて新たなタスクを定義する手法について提案した.上位となる新規のタスクは下位となる既存のタスクに対する優先度の制御を行動とみなし,行動学習を行うことで上位のタスク達成を行う.また独立のタスク同士ではこれまで通り優先度の決定を独立に行い,全体として従来提案してきた優先度に基づく行動調停を行う.これにより漸次的に複雑なタスク達成を実現する手法を提案した.また多数のタスクを扱うことから優先度決定のための要因を従来の1次元から多次元に拡張する必要が生じた.そこで優先度決定のために用いている区分線形関数を多次元に拡張しつつ,より簡便に多次元入力を扱える他の関数の検討を行った. (2)については(1)で提案した手法に深層学習を組み込むために,深層強化学習の実装を行い,複数の学習空間の協調によって単一の行動を出力するシステムの実装を行い実験により稼働を確認した.また深層学習のハードウェアアクセラレーションとして,USB経由で接続される簡易デバイスを用いて学習時間短縮が可能であることを確認した. (3)についてはSBCをベースとした実ロボットについて,製作・完成品の購入の両面から検討を行っており,半導体不足の状況に応じてi)クローラ型製作,ii)クローラ型購入・改造,iii)脚式製作,iv)人形購入と選択肢を検討している.
|