昨年度,強化学習モデルによって推定されるパラメータの個人内安定性や,精神疾患スコアの時間的変化との対応を確認するため,約2か月の期間を空けて2回のオンライン実験を実施した。本年度はまずこのデータの解析から行った。 解析ではまず選択過程を調整する性質として,価値に関係なく自分の過去のアクションを繰り返す固執性に注目した。従来使われてきた強化学習モデルでは固執性をパラメータとして含まないことが多い。そこで,固執性パラメータを含むモデルと,含まないモデルをデータにあてはめて情報量規準により比較した。結果,固執性パラメータを含むモデルが支持された。さらに,固執性パラメータを入れないと,学習率は小さく推定され,逆温度パラメータは大きく推定されることがわかった。このことは,広く使われている強化学習モデルだと,パラメータとして含まれない固執性の個人差が価値計算過程と選択過程の両方に影響を与え,誤った個人差の解釈を導いている可能性を示唆している。また,固執性入れたモデルでデータを詳しく検討したところ,逆温度のパラメータが小さいこと,つまり選択をランダムに行う傾向は,将来のうつ傾向の高さを予測することがわかった。 その後,同じ課題を用いて実験を行い,うつ病や不安症などの精神疾患と,その関連が指摘されている不眠症について,強化学習モデルのパラメータによってその特徴を分離できるか試みた。その結果,不安の高い個人では,価値に基づく計算がしづらい,ポジティブな結果を学習に取り込みにくい,といった特徴がみられ,不眠症傾向の高い個人では,ポジティブな結果を学習に取り込みやすい,という特徴がみられた。 その他,価値計算過程のモデル誤設定が,fMRIを用いた研究での群間比較に与える影響についてシミュレーションを行い,実際には差がなくても差があるように見えてしまう可能性をまとめ,論文として報告している。
|