2019 Fiscal Year Annual Research Report
Identification of neural basis of animal behavioral strategy by inverse reinforcement learning
Project/Area Number |
16K16147
|
Research Institution | Kyoto University |
Principal Investigator |
本田 直樹 京都大学, 生命科学研究科, 准教授 (30515581)
|
Project Period (FY) |
2016-04-01 – 2020-03-31
|
Keywords | 行動戦略 / 数理モデル / 機械学習 |
Outline of Annual Research Achievements |
これまで動物の行動時系列データから行動戦略を解読する逆強化学習法を開発し、線虫温度走性へと適用することで、その有効性を示してきた。しかし、この手法は行動の背後にある戦略は一つであることを前提としており、複数の行動戦略を時間的に切り替えながら行動している動物への適用には問題があった。そこ本年度は複数の行動戦略とそれら切り替えタイミングを解読する逆強化学習法の開発を行い、実データへの応用を行った。その結果、培養温度に向かうゴール志向的戦略と等温線上を移動する保守的戦略をクリアに切り分けることに成功し、またそれぞれの戦略の際、移動の際の体の使い方が全く異なることを明らかにした。
|