2016 Fiscal Year Annual Research Report
報酬の相対的価値とそれを補正する心理神経メカニズム
Project/Area Number |
15J10796
|
Research Institution | Nagoya University |
Principal Investigator |
遠山 朝子 名古屋大学, 環境学研究科, 特別研究員(PD)
|
Project Period (FY) |
2015-04-24 – 2017-03-31
|
Keywords | モデルベース学習 / モデルフリー学習 / 強化学習 / 計算論モデル |
Outline of Annual Research Achievements |
文脈の情報を取り入れて価値を更新していく学習過程は、モデルベースの学習と呼ばれる。一方、文脈情報には依らず直接経験に基づいて、比較的自動的に価値を更新する学習過程はモデルフリーの学習と呼ばれる。本研究では、両学習の比重の個人差を検討する2段階意思決定課題を用い、これらの学習が統合されるメカニズムを計算論モデルとして提案することを目指した。実験で得られたデータをもとに構築した新しい計算論モデルは、従来のモデルと2つの点で大きく異なる。1点目は、モデルフリーとモデルベースの価値を統合するメカニズムに関する部分であり、従来のモデルが、2つの価値を独立に計算して統合することを仮定しているのに対し、新しいモデルでは、モデルフリーの価値更新でよく使われるeligibility traceに着目し、これが環境の確率モデルで修飾されることを仮定した。2点目は、選択しなかった価値がデフォルト価値に回帰する過程を新しく導入した点である。これらの改良の結果、新しいモデルは従来のモデルよりも実際のデータによく適合し、また、そこで使われるパラメターが意思決定に関わる重要な個人差をよりよく反映していることが示された。本研究の成果については論文としてまとめ、国際誌にて発表した。 また、この結果をさらに強固なものにするために、追加の実験も行い、先に提案した計算論モデルが支持されることを確かめた。この追加実験では、意思決定の個人差を安定して取り出すために、各参加者が複数の選択課題と質問紙への回答を行い、抹消自律神経系の活動についても記録した。現在、得られたデータに対し解析を行っているが、心拍変動とモデルベースの程度の相関がみられるなど、興味深い結果が得られている。
|
Research Progress Status |
28年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
28年度が最終年度であるため、記入しない。
|
Research Products
(1 results)