研究課題/領域番号 |
16K16147
|
研究種目 |
若手研究(B)
|
配分区分 | 基金 |
研究分野 |
生命・健康・医療情報学
|
研究機関 | 京都大学 |
研究代表者 |
本田 直樹 京都大学, 生命科学研究科, 准教授 (30515581)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
研究課題ステータス |
完了 (2019年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2019年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2018年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2017年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2016年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
|
キーワード | 逆強化学習 / 機械学習 / 行動戦略 / 意志決定 / 線虫 / 報酬 / データ解析 / 数里モデル / 数理モデル / 人工知能 / 行動学 / 神経科学 / 制御工学 / 動物 |
研究成果の概要 |
動物は状況に応じて、より多くの報酬が期待できる行動戦略を獲得することで、環境に適応する。しかしながら、自由行動下の動物が持つ行動戦略を定量化する手法は確立していなかった。そこで本研究では、動物の行動時系列データの背後にある行動戦略を価値関数として推定する逆強化学習法を考案した。そして、線虫の温度走性行動へと適用することで、線虫が持つ行動戦略を明らかにすることに成功した。本手法は神経活動とその表現形である行動戦略をつなぐ基盤技術を提供するもので、今後、動物の行動戦略を司る神経メカニズムの解明に大きく貢献することが期待される。
|
研究成果の学術的意義や社会的意義 |
ヒトや動物は、より多くの報酬を得るため、状況に応じた「行動戦略」を持って生きている。報酬には食べ物やお金など実態の伴うものだけでなく、間接的にそれらに結びつくものも含まれており、自由に行動している動物を単に観察しているだけでは、「動物にとって何が報酬となっているのか?」を知ることは困難であった。そこで本研究では動物の行動データから報酬に基づく行動戦略を明らかにする機械学習法を考案した。そして、線虫の行動へと適用することで、手法の有効性を示した。本手法によって、従来の行動が制限された行動実験系から開放され、より自然な状況おいて自由に振る舞う動物の行動戦略の研究が進むことが期待される。
|