• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

あいまいな人間のフィードバックからの強化学習

研究課題

研究課題/領域番号 24KJ0610
研究種目

特別研究員奨励費

配分区分基金
応募区分国内
審査区分 小区分61030:知能情報学関連
研究機関東京大学

研究代表者

CAI Xinqiang  東京大学, 大学院新領域創成科学研究科, 特別研究員(DC2)

研究期間 (年度) 2024-04-23 – 2026-03-31
研究課題ステータス 交付 (2024年度)
配分額 *注記
1,500千円 (直接経費: 1,500千円)
2025年度: 500千円 (直接経費: 500千円)
2024年度: 1,000千円 (直接経費: 1,000千円)
研究開始時の研究の概要

The project aims to improve how smart systems learn from human guidance, making them more effective even when clear instructions aren't available. I am committed to designing new ways for these systems to interpret feedback better and adapt to real-world tasks.

URL: 

公開日: 2024-04-24   更新日: 2024-07-03  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi