遅延時間をおいて与える報酬によって行う条件づけは、多種の動物で可能であり、内的な時間の表現や報酬の価値づけとの関係を探り、共通の土台で異種間比較するために有用な方法である。本研究課題では、経過時間を内的にどのように表現しているのかを探るための枠組を構築することを目標として、その糸口となりうる興味深い条件づけの知見に注目した。近年、光と音にそれぞれ異なる時間間隔を条件づけした後、光と音の複合刺激を与えると、その中間にあたる時間で反応が起こる現象が見つかった。経過時間は脳内の状態として表現され、それに応じて反応している、と考えると、各々の時間帯で反応が起こるはずで、観測された現象と矛盾する。本研究では、この矛盾を解消する理論的枠組を構築した。まずパブロフ型条件づけのモデルとして確立しているレスコーラ・ワグナーモデルに注目した。レスコーラ・ワグナーモデルの特徴は、複合刺激の場合に条件づけの効果がそれぞれの線形和とする仮定にある。この要素を、研究代表者が本領域の公募研究の前半に整備してきた連続時間の強化学習の枠組に融合した。その上で、異なる時間間隔を条件づけした光と音の複合刺激に対する反応を再現するためには、経過時間や内部状態、反応の仕方や価値を、どのように表現することが必要であるか、レスコーラ・ワグナーモデルの線形和の要素をどの表現に適用するべきか、理論的に導出した。その結果、感覚刺激が得られた時点で、どのぐらいの時間が経った後に反応するのかを選択しているとすれば、先行研究で見つかっている現象を再現することがわかった。この仮説を検証するための行動実験課題を設計し、現実的な試行数で仮説検証できるような課題パラメータ探索を行った。
|