2009 Fiscal Year Annual Research Report
あいまで変動する環境におけるモジュール型意思決定モデルの研究
Project/Area Number |
21300113
|
Research Institution | Kyoto University |
Principal Investigator |
石井 信 Kyoto University, 情報学研究科, 教授 (90294280)
|
Co-Investigator(Kenkyū-buntansha) |
中村 泰 大阪大学, 工学研究科, 助教 (70403334)
前田 新一 京都大学, 情報学研究科, 助教 (20379530)
|
Keywords | 強化学習 / モジュールアーキテクチャ / 計算論的神経科学 / ロボット / 非侵襲脳計測 |
Research Abstract |
マルチモジュール型学習アルゴリズムの開発 複数モジュール型制御アルゴリズムを、mixture-of-expertsの統計学習として定式化し、オンライン学習法としてアルゴリズム化した。また、複数の基底関数から線形表現される価値関数のオンライン学習において、基底関数を動的に配置するアルゴリズムを導出して、従来法よりも効率が良いことを示した(Mori and Ishii, 2009)。また、価値関数ベースの強化学習法の一般形をセミパラメトリック統計に基づき導出し、漸近的推定分散最小となるオンラインアルゴリズムを求めた(Ueno, et al., 2009 ; Ueno, et al., to appear)。 多階層タスクにおける推論過程の認知科学的解明 二つの階層を持つ複雑なルール推論課題を被験者に課し、低い階層および高い階層での推論過程に関わる神経基盤を核磁気共鳴図(fMRI)非侵襲脳活動計測によって調べた。階層ごとに、異なる前頭前野の領域がその推論に関わる可能性が示唆された(Yoshida, et al., 2009)。 多関節ロボットの制御 26本の人工筋肉で動作する多関節ロボットの制御系の拡張を進めた。人間がロボットの手を持って運動をさせた際の軌道をみまね学習させ、一方で、自由制御下でのロボットの逆キネマティクスを学習させ、この二つを組み合わせるモデル同定制御法を開発した。簡単な握手運動の生成に適用し、本手法により複雑な多関節ロボットの制御が可能であることを示した(Nishioka, et al., 2010)。
|
Research Products
(9 results)