動物や人間はストレスの有無に応じて行動が大きく変化することが知られており、その変化は精神疾患とも関連することが指摘されている。リスクの高い状況下での行動決定に対するストレスの役割やそれに伴う行動変化を数理モデルとして記述することが重要だと考えられる。 本年度は、リスクの有無によって生じる行動変化を理解するための数理モデルの構築に着手した。一見非合理に見えるような行動が再現性高く観測される実験例は経済学でこれまでによく研究されている。特に、リスクを伴う状況での非合理な行動に関しては、複数の「パラドックス」と呼ばれる行動実験結果が報告されている。 そのうちの一部の行動結果に関しては、それを説明する理論も提唱されている。しかし、その理論を適用する際には状況依存的な解釈が必要であったり、その理論では他の行動パラドックスは説明できなかったりするために、十分な理解が得られていない。我々は、考察の結果、従来理論では価値関数の基準点に関して明確な設定指針が無く、基準点の設定に仕方に応じて従来理論の予測訂正的に変化してしまうことが一つの問題点であることを発見した。 そこで、強化学習の予測誤差の計算を手がかりに、従来理論の価値関数の基準点を設定したところ、これまでの実験結果を良く再現できることが分かった。また、このようにして基準点を設定したモデルは、より一般的な状況に適用できる可能性があることが示唆された。
|