• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

Path Signatureを用いた意思決定問題の一般化と学習理論の再定義

研究課題

研究課題/領域番号 25K21157
研究種目

若手研究

配分区分基金
審査区分 小区分60020:数理情報学関連
研究機関愛媛大学

研究代表者

大西 基也  愛媛大学, 理工学研究科(理学系), 准教授 (71007234)

研究期間 (年度) 2025-04-01 – 2030-03-31
研究課題ステータス 交付 (2025年度)
配分額 *注記
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2029年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2028年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2027年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2026年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2025年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
キーワード学習理論 / Path Signature / 動的システム / 制御理論
研究開始時の研究の概要

動的システムの制御を対象とする機械学習分野である強化学習は,脳科学および純粋なアルゴリズムとしての研究としても歴史を持つ.近年は深層強化学習のロボティクス分野等を対象とした発展や大規模言語モデルへの人間のフィードバックの適用等の応用を含めて活発に研究されている.しかしながら,これら(ベルマン方程式に基づく)価値関数の最適化という定式化では容易に対応できない問題は多岐にわたる.一例としては経路追従問題があげられる.本研究では,Signatureを用いた新しい意思決定問題の研究および動的システムに基づく新しい学習理論パラダイム創出の探索的研究を行う.

URL: 

公開日: 2025-04-17   更新日: 2025-06-20  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi