本研究では、複雑環境における意思決定課題を設計およびプログラム実装し、ヒト被験者を用いた行動および脳活動計測実験を行うことにより、意思決定の脳内処理機構を解明することを試みる。ヒトの情報処理モデルとしては、強化学習などの機械学習理論を応用した計算モデルを提案し、シミュレーション実験によりモデルの検証を行った。本年度は、これまでに行った(1)モデル同定およびモデルフリー学習による罰回避行動実験と(2)被験者2名による観察学習課題について、脳計測実験およびデータ解析を引き続き行い、成果を論文としてまとめた。また、新たに被験者4名による共同意思決定課題を設計し、行動実験を行った。 罰回避行動実験について、2014年に新しく提案されたモデルフリーおよびモデル同定強化学習を並列に行い、各学習器の信頼性に基づいて行動を最終決定する計算モデルを行動解析に導入し、報酬依存学習における行動結果と比較した。罰回避の場合は、モデルフリーシステムの信頼性を決める「予測誤差の予測器」における学習パラメータが有意に大きくなり、罰回避では結果に応じて行動選択が脆弱になることを計算モデルに基づいて明らかにした。本研究の成果は国際論文誌に投稿する。観察学習実験については、相手の行動反応時間からDrift Diffution Modelに基づいてその信頼性を推定する学習モデルを用いた解析をさらに進め、成果を招待セミナーで発表した。解析結果の正当性を高めるため、行動選択のタイミングを同時に行う新しい観察学習課題を開発し、被験者16名の脳活動計測実験を行った。全ての成果は英語論文としてまとめ論文誌に投稿準備中である。さらに提案モデルを拡張した集団意思決定モデルを実装し、被験者4名が協力して意思決定を行う課題を用いた行動実験を行った。
|