研究領域 | こころの時間学 ―現在・過去・未来の起源を求めて― |
研究課題/領域番号 |
26119526
|
研究機関 | 玉川大学 |
研究代表者 |
酒井 裕 玉川大学, 脳科学研究所, 教授 (70323376)
|
研究期間 (年度) |
2014-04-01 – 2016-03-31
|
キーワード | 強化学習 / 時間割引 / 実験系心理学 / 機械学習 / 神経科学 |
研究実績の概要 |
動物は遅れて得られる報酬よりすぐに得られる報酬を好む。これは遅延報酬の価値を主観的に割り引いているからであると考えられている。この割引の時間的特性は、遅延期間中にただ連続的に時間が経過するときには双曲型で、試行をまたいで離散的に時間ステップが進むときには指数型になることが示唆されている。脳内に連続的な時間と離散的な時間が存在し、役割の異なる割引を行っているのではないだろうか。遅延報酬に対する選好の時間特性は多種の動物で観測されており、同一の比較基準で脳内時間に関わる特性を比較するための土台として有用と考えられる。 研究代表者は先行研究で、強化学習理論の中で時間割引を取り入れた「割引価値問題」という枠組みを動物行動に適用すると、しばしば枠組み自体が破綻することを示した。そして、破綻しない枠組みを構築するためには、時間割引特性の異なる時点(イベント)が存在する必要があり、そのイベント間に経過する連続時間とイベントによって時間ステップが進むときでは異なる特性の割引となることが導出された。全く異なる目的のために導出した結果が、他の実験的知見と整合したため、提案した枠組みは本質に近づいている可能性が高いと考えられる。 この枠組みを確かめるための行動実験課題を設計した。離散的な時間ステップとその連続的な間隔を制御して、選択肢それぞれに報酬遅延と報酬量を割り当て、試行を越えた効果を導入しながら、連続的な遅延時間の効果も同時に導入した課題を設計した。できるだけ少数の試行数で提案した枠組みの正当性を判別するための課題パラメータサーチを行った。さらに領域内の平田班(チンパンジー・ボノボ対象)との共同研究を開始し、類人猿に合わせた具体的な課題設計と課題の実装を行い、平田班において予備実験を開始した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
領域内の動物実験を行っている班との議論の成果として、計画調書に記載した行動実験課題より、さらに簡潔に動物実験が可能な行動実験課題に修正した点以外は、計画通りに進んでいる。この計画修正は、今後、共同研究を通じて動物実験を行っていくにあたり、より円滑にする修正であり、今後の順調な進捗を期待できる。
|
今後の研究の推進方策 |
平田班との共同研究により、実際の動物実験の実施に向けて、推進する。動物実験において、予想外の問題が生じる可能性があるが、問題が生じた段階で対処する。
|