研究課題/領域番号 |
25K21157
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分60020:数理情報学関連
|
研究機関 | 愛媛大学 |
研究代表者 |
大西 基也 愛媛大学, 理工学研究科(理学系), 准教授 (71007234)
|
研究期間 (年度) |
2025-04-01 – 2030-03-31
|
研究課題ステータス |
交付 (2025年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2029年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2028年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2027年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2026年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2025年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
|
キーワード | 学習理論 / Path Signature / 動的システム / 制御理論 |
研究開始時の研究の概要 |
動的システムの制御を対象とする機械学習分野である強化学習は,脳科学および純粋なアルゴリズムとしての研究としても歴史を持つ.近年は深層強化学習のロボティクス分野等を対象とした発展や大規模言語モデルへの人間のフィードバックの適用等の応用を含めて活発に研究されている.しかしながら,これら(ベルマン方程式に基づく)価値関数の最適化という定式化では容易に対応できない問題は多岐にわたる.一例としては経路追従問題があげられる.本研究では,Signatureを用いた新しい意思決定問題の研究および動的システムに基づく新しい学習理論パラダイム創出の探索的研究を行う.
|