研究課題/領域番号 |
25K15252
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 東京理科大学 |
研究代表者 |
小玉 直樹 東京理科大学, 創域理工学部経営システム工学科, 助教 (60908747)
|
研究分担者 |
宮崎 和光 独立行政法人大学改革支援・学位授与機構, 研究開発部, 教授 (20282866)
原田 拓 東京理科大学, 創域理工学部経営システム工学科, 教授 (70256668)
|
研究期間 (年度) |
2025-04-01 – 2028-03-31
|
研究課題ステータス |
交付 (2025年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2027年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2026年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2025年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | 強化学習 / 機械学習 / ニューラルネットワーク / 交通信号機制御 / ゲーム問題 |
研究開始時の研究の概要 |
強化学習とニューラルネットワークを組み合わせた深層強化学習は様々な分野で成果を上げている。研究代表者らは、強化学習が目指す報酬の最大化の代わりに成功体験の模倣を目的としたヒューリスティックな接近法である経験強化型学習に注目している。 本研究では、研究期間前半において従来の深層強化学習手法とDeePSを融合させたHybrid DeePSを提案を目指す.研究期間後半において,ここで提案したHybrid DeePSを分散信号機制御システム、科目分類支援システム、ロボットなどを題材とした実問題への応用によりその有効性の検証を行う。
|