研究課題
本研究の目的は、BMI(brain-machine interface)を使用中に学習や疲労などによりヒトの脳活動状態が非定常的に変化することをモデル化することによって、ヒトの潜在的な心理状態に応じた柔軟なフィードバック・スキームを提供するリアルタイム共適応BMIシステム確立することである。その実現のため、本年度は、BMIデコーダの強化学習アルゴリズムの開発と実装、非定常なヒトの心理状態をモデル化するための情報表現法の研究、およびオンライン適応BMIシステムの評価実験のために実環境でランプを用いてBMIの結果をフィードバッックするシステムの構築を実施した。昨年度の成果であるUeno et al. (NIPS 2012)の重み付尤度に基づく方策探索法の枠組みをヒトの心理状態に対応する潜在変数を導入した混合型の方策関数に拡張し、潜在変数に関する統計モデルの推定と各モジュールでの強化学習を同時に実行するための理論体系を導出した。さらに、最適な方策パラメータを求める際に用いるQ関数をカーネル近似することにより実用的なアルゴリズムを開発・実装した。昨年度から継続実施しているEEG信号の非定常性も考慮した脳活動の情報表現の研究については、非定常性に対してロバストな情報表現を構築するための方法として、maxmin-CSP(Kawanabe et al., 2014)、ベータダイバージェンスによるCSP法(Samek et al., 2013)、ダイバージェンスに基づく空間フィルタ構築法の一般的な枠組み(Samek et al. 2014)などの学術的成果を達成した。最終年度は、非定常なヒトのEEG信号の遷移を記述するモデルおよび解析結果からの知見と上記の強化学習アルゴリズムに反映し、取得予定のBMIデータに適用する。
2: おおむね順調に進展している
共適応BMIのための強化学習アルゴリズムは一部最終年度の研究項目であるヒトの心理状態を表す潜在変数を取り入れた形でのモデルに基づいて開発を行っている。本年度はオンライン共適応BMIシステムの評価のために、実環境とのインタラクションが複雑になるロボットカー制御によるフィードバックではなく、データ取得がより容易なランプを用いたフィードバックシステムを構築することとした。この変更により最終目標の達成にむけより効率的な研究開発が期待される。
今後は、EEG信号の非定常性に関する解析とモデル化をさらに進め、ヒトの潜在的心理状態を考慮した強化学習システムを完成・性能評価するとともに、成果の最終とりまとめを行う。
直接経費次年度使用額が0以外であるのは、H25年度に2台購入予定であったワークステーションをより高性能なもの1台に変更し、システムを実装する研究補助員を雇用する代わりに、その一部であるフィードバック可視化システム構築の外注に振り替えたためである。最終年度に必要なオンライン共適応BMIシステムの評価を行うためのワークステーション1台を追加購入し、実験データを保存するためのストレージを2台購入する予定である。また、システム実装を完了するために必要な研究補助員雇用もしくは外注を実施する。
すべて 2014 2013
すべて 雑誌論文 (4件) (うち査読あり 4件) 学会発表 (10件) (うち招待講演 4件)
NeuroImage
巻: 90 ページ: 128-139
10.1016/j.neuroimage.2013.12.035
Neural Computation
巻: 26 ページ: 349-376
10.1162/NECO_a_00544
IEEE Reviews in Biomedical Engineering
巻: 7 ページ: 50-72
10.1109/RBME.2013.2290621
Neural Networks
巻: 46 ページ: 133-143
10.1016/j.neunet.2013.05.007