マルチエージェント逆強化学習による動物の集団形成を制御する意思決定機構の解明
Project/Area Number |
22K15181
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 45040:Ecology and environment-related
|
Research Institution | Fujita Health University |
Principal Investigator |
佐藤 大気 藤田医科大学, 医科学研究センター, 助教 (50912060)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2024: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2023: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2022: ¥2,730,000 (Direct Cost: ¥2,100,000、Indirect Cost: ¥630,000)
|
Keywords | ショウジョウバエ / トラッキング / 恐怖刺激 / 逆強化学習 / 集団行動 / 恐怖反応 |
Outline of Research at the Start |
本研究では、視覚的な恐怖刺激を与えた際のキイロショウジョウバエの群れ行動から、逆強化学習を利用した報酬推定を行なうことで、恐怖刺激に晒された個体が周囲の他個体の存在に対してどのような価値判断を行なうのか、情動処理における個体と集団の双方向的フィードバックを明らかにする。また、多数の近交系統を用いて価値関数を比較するとともに、各系統のゲノム配列データを用いてゲノムワイド関連解析を行なうことで、集団形成の意思決定に関わる遺伝的基盤を解明する。
|
Outline of Annual Research Achievements |
本研究では、①視覚的な恐怖刺激を与えた際のキイロショウジョウバエの群れ行動をトラッキングした上で、②逆強化学習を利用した報酬推定を行なうことで、恐怖刺激に晒された個体が周囲の他個体の存在に対してどのような価値判断を行なうのか、情動処理における個体と集団の双方向的フィードバックを明らかにする。また、③多数の近交系統を用いて価値関数を比較するとともに、各系統のゲノム配列データを用いてゲノムワイド関連解析を行なうことで、集団形成の意思決定に関わる遺伝的基盤を解明する。 本年度は、①Drosophila Genetic Reference Panel (DGRP)が提供するゲノム配列が既知の近交系キイロショウジョウバエ104系統の各々について、雌雄、単独・集団(6個体)条件別に視覚刺激実験(実験アリーナの上に掲げたディスプレイから捕食者を模したlooming stimulusを提示)を行ない、トラッキングデータを取得した(各n=20)。また、行動形質が様々に異なる16系統(メスのみ)について、2系統の総当たり組み合わせで混合集団を作成し、同様の実験条件でトラッキングデータを取得した(各n=20)。また、②マルチエージェント逆強化学習の実装に向けて、まず単独条件におけるトラッキングデータを用いて、個体の向きと(角)加速度というパラメータについて状態空間を定義し、Maximum Entropy IRLを用いた逆強化学習を行なった。その結果、刺激に対する反応の違いなど、各系統の行動形質を反映するような各パラメータの報酬価が推定され、解析手法は概ね妥当であるように考えられた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究計画通り、各系統の行動トラッキングデータを取得することができた。また、単独の個体における行動形質のパラメータ推定は概ね成功し、順調に進展しているといえる。
|
Strategy for Future Research Activity |
今後は、単独条件でのトラッキングデータを用いて、恐怖刺激に対する硬直反応など、他の行動形質についても逆強化学習による報酬推定を行う。また、集団条件のトラッキングデータに対して、他個体の存在(他個体との平均距離や向き)をパラメータに組み込み、同時的に複数個体で報酬推定を行ない、マルチエージェント逆強化学習への拡張を目指す。
|
Report
(1 results)
Research Products
(3 results)