2018 Fiscal Year Research-status Report
逆強化学習法による「動物の行動戦略を制御する神経基盤」の同定
Project/Area Number |
16K16147
|
Research Institution | Kyoto University |
Principal Investigator |
本田 直樹 京都大学, 生命科学研究科, 准教授 (30515581)
|
Project Period (FY) |
2016-04-01 – 2020-03-31
|
Keywords | 行動戦略 / 機械学習 / 人工知能 / 逆強化学習 |
Outline of Annual Research Achievements |
線虫の温度走性行動に対して逆強化学習を適用し、線虫が持つ報酬関数を推定した。その結果、線虫は「培養温度に向かう戦略」と「温度が変わらないことを好む戦略」の二つの混合戦略を持つことを示唆する結果が得られた。また、サロゲーションを用いた統計的検定を行うことで、これら二つの戦略はアーティファクトではないことを示した。実際、線虫は一定温度をトラッキングすることが知られていることから、本手法の妥当性が示された。現在は、複数の異なる戦略を持つ場合、戦略切り替えのタイミングまでも推定することができるように手法の拡張を行っているところである。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
逆強化学習法により線虫の温度走性における行動戦略を明らかにし、その成果を論文として出版することができた。一方で、予定していた行動戦略と神経活動との比較解析は、自由行動中の線虫の神経活動データを十分に得ることができていないため停滞している状況である。これらの状況を総合して、「②おおむね順調に進展している」と判定した。
|
Strategy for Future Research Activity |
開発した手法を、線虫だけではなく、別の動物の行動データへの適用を目指す。現在、自由行動化のマウスの神経活動を計測しているグループと議論を重ねているところである。
|
Causes of Carryover |
予定していた国際会議に別の予算で行ったため、次年度使用額が生じた。次年度は進行中の研究を論文としてまとめ、出版経費に使用する予定である。
|
Research Products
(6 results)