• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

間接的フィードバックに基づくオンライン学習理論の進展

研究課題

研究課題/領域番号 24K23852
研究種目

研究活動スタート支援

配分区分基金
審査区分 1001:情報科学、情報工学およびその関連分野
研究機関東京大学

研究代表者

土屋 平  東京大学, 大学院情報理工学系研究科, 助教 (00994683)

研究期間 (年度) 2024-07-31 – 2026-03-31
研究課題ステータス 交付 (2024年度)
配分額 *注記
2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
2025年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2024年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
キーワード機械学習 / 学習理論 / オンライン学習 / オンライン凸最適化 / バンディット問題
研究開始時の研究の概要

オンライン学習は,環境から逐次的に得られる情報をもとに意思決定を行い,累積報酬を最大化する枠組みである.オンライン学習では多様な定式化が存在し,特に選択した行動の報酬が直接観測されず,間接的なフィードバックが得られる問題が多く存在する.本分野における近年の大きな関心は,環境の性質に適応的に動作するアルゴリズムを構築することであるが,既存の間接的フィードバックのもとでのオンライン学習における適応的アルゴリズムは,複数の非最適性を有している.そこで,本研究課題では間接的フィードバックのもとでのオンライン学習において,それらの課題を解決したアルゴリズムの設計と理論解析を行う.

URL: 

公開日: 2024-08-01   更新日: 2024-09-13  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi