あいまいな人間のフィードバックからの強化学習

研究課題

研究課題/領域番号	24KJ0610
研究種目	特別研究員奨励費
配分区分	基金
応募区分	国内
審査区分	小区分61030:知能情報学関連
研究機関	東京大学
研究代表者	CAI Xinqiang 東京大学, 大学院新領域創成科学研究科, 特別研究員(DC2)
研究期間 (年度)	2024-04-23 – 2026-03-31
研究課題ステータス	交付 (2024年度)
配分額 *注記	1,500千円 (直接経費: 1,500千円) 2025年度: 500千円 (直接経費: 500千円) 2024年度: 1,000千円 (直接経費: 1,000千円)
研究開始時の研究の概要	The project aims to improve how smart systems learn from human guidance, making them more effective even when clear instructions aren't available. I am committed to designing new ways for these systems to interpret feedback better and adapt to real-world tasks.