研究課題/領域番号 |
24700238
|
研究機関 | 名古屋大学 |
研究代表者 |
片平 健太郎 名古屋大学, 環境学研究科, 准教授 (60569218)
|
キーワード | 主観的価値 / 強化学習 / 学習 / 統計モデル |
研究概要 |
本研究では生活体の意思決定に着目し,その行動に直接的に影響を与える潜在的な主観的価値を推定するための計算論的枠組みを構築することを目的とした。この目的のもと意思決定における価値計算過程に注目し,意思決定の実験データを記述する数理モデルを検討した。初年度である平成24年度は,ヒトを対象とした意思決定課題から強化学習モデルをベースに主観的価値を統計的推定方法により推定する方法を検討した。平成25年度は,その手法の頑健性を検討し応用範囲を広げるため,ヒト以外の動物の例としてラットの行動に対して本手法を適用した。具体的に行った研究課題は以下のようである。ラットには二つのレバーを呈示しいずれか一方を押すことを学習させ,ラットの選択に応じて確率的に報酬が出る課題を設定した。報酬の有無自体は選択に応じた確率で決定されるものの,報酬量(ペレットの数)や報酬遅延は選択とは無関係にランダムに決定された。しかしながらラットの行動はランダムに設定された報酬量や報酬遅延の影響を受けることが分かった。提案法を適用してその主観的価値を推定した結果,報酬量に関しては,主観的価値はペレットの数の単調増加関数となるという妥当な結果が得られた。報酬遅延時間については,主観的価値は遅延時間の逆U字型関数となった。すなわち,遅延が短ければ主観的価値が必ずしも高くなるのではなく,それが最大になる最適な遅延時間が存在するということである。これらの結果は,ヒト以外の動物の選択行動からも提案手法により主観的価値が推定可能であることを示したという意義がある。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成25年度は意思決定課題時における行動データから主観的価値を推定する方法を構築することと,その適用範囲を広げ新たな法則を発見することを目標とした。本年度の研究で提案手法が動物行動にも適用できることが確認でき,さらにこれまで知られていなかった新たな法則も発見された。したがって現在までの達成度はおおむね順調に進展しているものといえる。
|
今後の研究の推進方策 |
これまでの研究で主観的価値を推定する枠組みは構築できたといえるが,その推定値にどの程度信頼性があるかは明らかにはなっていない。次年度ではラットを対象とする実験を継続しながら,モデルをベースとした数値シミュレーションも併用し,推定された主観的価値にどの程度の信頼性があるかを検討する。また,適切なモデルを選択するための基準として用いられてきた赤池情報量基準やベイズ情報量基準がどの程度有効かも検討する必要がある。さらに,それらの結果をもとに,適切なモデル設定のもと信頼できる推定値を得るための最適な実験デザインについても研究する。最後に,本プロジェクトで開発した手法を他の研究者が使えるよう,プログラミング言語Python上で動作するフリーのツールキットとしてまとめてWeb上で公開する。
|
次年度の研究費の使用計画 |
代表者の平成25年度中の名古屋大学への異動に伴い,次年度以降に行う新しい研究環境の構築にかかる経費として次年度使用額が生じた。 実験装置制御用および解析用のデスクトップPC(約20万円)を購入する。ラット用のオペラント装置を新たに購入する(約40万円)。被験体となるラットを購入する(約3千円×50=15万円)。研究会等での情報収集および学会発表のための国内出張を行う(約5万円×4回=20万円)。
|