Publicly Offered Research
Grant-in-Aid for Transformative Research Areas (A)
本研究では,生物の意思決定モデルとして注目されている強化学習において,将来の収益に関する予測誤差と学習量との間に潜む多様な非線形性を確率推論としての強化学習に則って理論的に導出する.また,得られた非線形性を複合的に・選択的に継承可能なアンサンブルモデルを設計し,その更新原理を自由エネルギーなどの普遍的規範に基づき確立する.こうして導かれる新たな強化学習を駆使して,生物の意思決定モデルの精緻化を図る.