• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2023 年度 研究成果報告書

利益分配原理に基づく深層強化学習の革新的進化と実問題への応用に関する研究

研究課題

  • PDF
研究課題/領域番号 21K12024
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分61030:知能情報学関連
研究機関独立行政法人大学改革支援・学位授与機構

研究代表者

宮崎 和光  独立行政法人大学改革支援・学位授与機構, 研究開発部, 教授 (20282866)

研究分担者 山口 周  独立行政法人大学改革支援・学位授与機構, 研究開発部, 特任教授 (10182437)
原田 拓  東京理科大学, 創域理工学部経営システム工学科, 准教授 (70256668)
小玉 直樹  明治大学, 理工学部, 助教 (60908747)
研究期間 (年度) 2021-04-01 – 2024-03-31
キーワード深層強化学習 / 強化学習 / 深層学習 / 利益分配原理 / 経験強化型学習
研究成果の概要

本研究では、当初の目的であった「利益分配原理に基づく学習結果のばらつきを抑えた深層経験強化型学習」であるDeep Profit Sharing methodの基本設計を完成させた後、対象問題クラスに関するふたつの副目標を考慮した実問題への応用例を拡充させた。具体的には、当初予定していた「スマートエネルギーシステムへの応用」を達成するとともに、「カリキュラム分析支援システムへの応用」についても一定の成果を得た。さらに、当初想定していなかった応用例として、道路交通信号機制御に適用し一定の成果を得た上で、ネガティブツイートの抑制、Angry Bird AI Competitionへの適用を開始した。

自由記述の分野

機械学習、人工知能

研究成果の学術的意義や社会的意義

本研究では「利益分配原理に基づく学習結果のばらつきを抑えた深層経験強化型学習」であるDeep Profit Sharing method(DeePS)の有効性を主張できた。これは、動的計画法や政策の直接探索に基づく手法が主流を占める深層強化学習の世界に一石を投じるものであり、学術的意義が大きい。通常、それらの手法では、学習に多くの試行錯誤を要するが、DeePSは、より少ない経験でいかに学習するかを主眼に置いており、実問題への応用において、特に、威力を発揮するものと考える。実際、本研究では、複数の実問題に応用し、DeePSの有効性を示すことができたので、得られた成果の社会的意義は大きいと言える。

URL: 

公開日: 2025-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi