2021 Fiscal Year Research-status Report
Project/Area Number |
19K21809
|
Research Institution | The University of Tokyo |
Principal Investigator |
森田 賢治 東京大学, 大学院教育学研究科(教育学部), 准教授 (60446531)
|
Co-Investigator(Kenkyū-buntansha) |
永瀬 麻子 鳥取大学, 医学部, 特別研究員(PD) (40826658)
|
Project Period (FY) |
2019-06-28 – 2023-03-31
|
Keywords | 負荷 / 価値学習 |
Outline of Annual Research Achievements |
昨年度に引き続き、強化学習理論の枠組みを用いた、負荷のかかる行動を取る意思決定に関する理論的検討を進めた。次元削減されたsuccessor representationという状態表現が用いられた場合に、価値の不正確な近似によって、負荷のかかる行動を取る選択肢よりも、それを回避する選択肢の方が価値が高く見積もられ、それゆえ負荷の回避すなわち先延ばしが生じうる可能性について、負荷(コスト)の大きさ、学習率、選択における探索の度合い(逆温度)を変えた場合も含めシミュレーションを行って検討し、それらパラメータのある程度の範囲において、先延ばしが生じることを示した。また、負荷を回避することによるある種の「ペナルティ」、あるいは予期されない後悔がある場合についても、それぞれそれらを表すことを想定した形に拡張したモデルを用いて検討し、前者によって先延ばしが減る可能性を示した。また、状態表現自体が徐々に更新されていく場合も検討し、これによっても先延ばしが減る可能性を示した。一方、負荷のかかる行動を取るか否かの意思決定・先延ばしの実験的研究について、オンラインでの実施も踏まえた実験課題のデザインおよびプログラム準備や、同時に使用する質問紙の検討・選定を進めた。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
新型コロナウイルス感染拡大の状況により実験を見合わせてきたため遅れている。
|
Strategy for Future Research Activity |
状況によりオンラインでの実施も含め、安全に十分注意しつつ、実験・調査を実施する。理論モデル・計算論的研究についても引き続き進める。
|
Causes of Carryover |
前述のように実験を見合わせてきたため次年度使用額が生じた。実験・調査(オンライン実施も含む)の謝金、人件費、理論研究に必要なコンピュータ等、研究打ち合わせ、および研究結果の発表に関わる費用などに使用していく予定である。
|
Research Products
(2 results)