「鏡像降下法を基盤にした強化学習アルゴリズムの設計」「鏡像降下法とベイズ学習の関係理解」「強化学習アルゴリズムの応用」という構成で研究を進めた. アルゴリズム設計では,鏡像降下法を基盤にderivative freeアルゴリズムを設計した.さらに,鏡像降下法の拡張を行った上で同様の手続きを行うという手順により,強化学習アルゴリズムの拡張が可能であることを示した.鏡像降下法からベイズの定理が導出できることに着目し,統計的推定アルゴリズムと強化学習アルゴリズムの接点について研究を行った.設計した強化学習アルゴリズムの応用事例研究として,多自由度の強化学習問題と,ロボットアーム制御問題を扱った.
|