研究概要 |
モジュール型意思決定アルゴリズムの開発と評価(前田新一、石井信) マルチモジュール型システム同定強化学習法、特にサンプル数が増えるにしたがってモジュールを追加することで環境適応を行うことができる手法を開発した(Mori & Ishii, 2012}。また、不確実性のある環境においても適合可能な意思決定アルゴリズムである方策勾配学習法(GPOMDP)を非ホロノミック制御問題に適用し、制御則が自律的に獲得可能であることを示した(Nakano, Maeda, & Ishii, submitted)。さらに、価値ベースの強化学習法において、価値関数の線形近似器がバイアスを持つ場合の学習過程の漸近解析を行った(Ueno, Maeda, Ishii, to appear)。 意思決定モデルの脳内実装可能性の評価(石井信) 環境における不観測変数が多次元となる場合であってその推論を行うタスク(不完全迷路探索課題)を被験者に課し、行動実験、および核磁気共鳴図(MRI)を用いた非侵襲脳活動計測実験を実施した。行動実験において、被験者の脳内推論状況を隠れマルコフモデルを用いて再現可能であることを示した。また、非侵襲脳活動計測実験において、MRI信号から脳内推論をデコード可能であることが分かった(推論の各次元に対し、被験者により最高で75%程度のデコード性能が示さ・れた)。 脳信号からのロボットハンド制御のための技術開発(中村泰、前田新一) 脳信号からロボットハンドを制御することを目的として、まず、脳活動から少数のマーカ位置を再構成する手法をベイズ的正準相関解析法に基づき開発した。また、少数のマーカ位置から多自由度の手指形状を再構成する手法を線形回帰法に基づき開発した。これらを組み合わせることで、脳活動から多自由度の手指形状を再構成する方法の基本実装を終えた。マーカ位置によっては相関係数0.65程度となる再構成が可能であることが分かった。ただし、ロボットハンドの制御にまで至らなかった。また、累積したデータを直接利用したロボットの制御手法を提案し、多数の自由度を持つロボットアームの制御に適用した。
|