• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

利益分配原理に基づく深層強化学習の革新的進化と実問題への応用に関する研究

研究課題

研究課題/領域番号 21K12024
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分61030:知能情報学関連
研究機関独立行政法人大学改革支援・学位授与機構

研究代表者

宮崎 和光  独立行政法人大学改革支援・学位授与機構, 研究開発部, 教授 (20282866)

研究分担者 山口 周  独立行政法人大学改革支援・学位授与機構, 研究開発部, 特任教授 (10182437)
原田 拓  東京理科大学, 創域理工学部経営システム工学科, 准教授 (70256668)
小玉 直樹  明治大学, 理工学部, 助教 (60908747)
研究期間 (年度) 2021-04-01 – 2024-03-31
研究課題ステータス 完了 (2023年度)
配分額 *注記
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
キーワード深層強化学習 / 強化学習 / 深層学習 / 利益分配原理 / 経験強化型学習 / 深層経験強化型学習 / スマートエネルギーシステム / 道路交通信号機制御 / ツイートデータ / 意識的意思決定システム / 信号機制御 / ロボット制御
研究開始時の研究の概要

近年、深層強化学習が注目されているが学習に多くの試行錯誤を要するという問題がある。それに対し研究代表者らは、経験を強く強化する接近法である経験強化型学習における利益分配原理に基づく手法を提案し、試行錯誤回数の削減を実現している。しかし、学習結果がばらつく場合が多く解決が望まれていた。そこで本研究では、ばらつきを抑えた深層経験強化型学習の提案を主目標に掲げる。さらに副目標としてマルコフ決定過程を超えるクラスやマルチエージェント環境下での挙動の明確化を掲げ、実問題への応用を通じ提案手法の有効性を主張する。その結果、新たな選択肢となり得る手法が確立し実問題への適用レベルを飛躍的に向上できると考える。

研究成果の概要

本研究では、当初の目的であった「利益分配原理に基づく学習結果のばらつきを抑えた深層経験強化型学習」であるDeep Profit Sharing methodの基本設計を完成させた後、対象問題クラスに関するふたつの副目標を考慮した実問題への応用例を拡充させた。具体的には、当初予定していた「スマートエネルギーシステムへの応用」を達成するとともに、「カリキュラム分析支援システムへの応用」についても一定の成果を得た。さらに、当初想定していなかった応用例として、道路交通信号機制御に適用し一定の成果を得た上で、ネガティブツイートの抑制、Angry Bird AI Competitionへの適用を開始した。

研究成果の学術的意義や社会的意義

本研究では「利益分配原理に基づく学習結果のばらつきを抑えた深層経験強化型学習」であるDeep Profit Sharing method(DeePS)の有効性を主張できた。これは、動的計画法や政策の直接探索に基づく手法が主流を占める深層強化学習の世界に一石を投じるものであり、学術的意義が大きい。通常、それらの手法では、学習に多くの試行錯誤を要するが、DeePSは、より少ない経験でいかに学習するかを主眼に置いており、実問題への応用において、特に、威力を発揮するものと考える。実際、本研究では、複数の実問題に応用し、DeePSの有効性を示すことができたので、得られた成果の社会的意義は大きいと言える。

報告書

(4件)
  • 2023 実績報告書   研究成果報告書 ( PDF )
  • 2022 実施状況報告書
  • 2021 実施状況報告書
  • 研究成果

    (39件)

すべて 2024 2023 2022 2021

すべて 雑誌論文 (11件) (うち査読あり 11件、 オープンアクセス 4件) 学会発表 (27件) (うち国際学会 11件) 図書 (1件)

  • [雑誌論文] Proposal of a Course-Classification Support System Using Deep Learning and its Evaluation When Combined with Reinforcement Learning2024

    • 著者名/発表者名
      Miyazaki Kazuteru、Yamaguchi Shu、Mori Rie、Yoshikawa Yumiko、Saito Takanori、Suzuki Toshiya
    • 雑誌名

      Journal of Advanced Computational Intelligence and Intelligent Informatics

      巻: 28 号: 2 ページ: 454-467

    • DOI

      10.20965/jaciii.2024.p0454

    • ISSN
      1343-0130, 1883-8014
    • 年月日
      2024-03-20
    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Suppression of negative tweets using reinforcement learning systems2024

    • 著者名/発表者名
      Miyazaki Kazuteru、Miyazaki Hitomi
    • 雑誌名

      Cognitive Systems Research

      巻: 84 ページ: 101207-101207

    • DOI

      10.1016/j.cogsys.2023.101207

    • 関連する報告書
      2023 実績報告書
    • 査読あり
  • [雑誌論文] Performance evaluation of character-level CNNs using tweet data and analysis for weight perturbations2024

    • 著者名/発表者名
      Miyazaki Kazuteru、Ida Masaaki
    • 雑誌名

      Artificial Life and Robotics

      巻: 29 号: 2 ページ: 266-273

    • DOI

      10.1007/s10015-024-00944-9

    • 関連する報告書
      2023 実績報告書
    • 査読あり
  • [雑誌論文] Enhanced Naive Agent in Angry Birds AI Competition via Exploitation-oriented Learning2024

    • 著者名/発表者名
      Miyazaki Kazuteru
    • 雑誌名

      Journal of Robotics and Mechatronics

      巻: 掲載予定

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Proposal and Evaluation of a Course-Classification-Support System Emphasizing Communication with the Sub-committees Within the Committee of Validation and Examination for Degrees2023

    • 著者名/発表者名
      Miyazaki Kazuteru、Yamaguchi Syu、Mori Rie、Yoshikawa Yumiko、Saito Takanori、Suzuki Toshiya
    • 雑誌名

      Lecture Notes of the Institute for Computer Sciences, Social Informatics and Telecommunications Engineering

      巻: 477 ページ: 123-130

    • DOI

      10.1007/978-3-031-29126-5_10

    • ISBN
      9783031291258, 9783031291265
    • 関連する報告書
      2022 実施状況報告書
    • 査読あり
  • [雑誌論文] Surface Hydroxyl-Ion Diffusion and Hierarchical Structure of Adsorbed Water on Hydrated Layered Double Hydroxides2023

    • 著者名/発表者名
      Yamasaki Tomoyuki、Iimura Soshi、Hosono Hideo、Yamaguchi Shu
    • 雑誌名

      The Journal of Physical Chemistry C

      巻: 127 号: 12 ページ: 6045-6053

    • DOI

      10.1021/acs.jpcc.3c00275

    • 関連する報告書
      2022 実施状況報告書
    • 査読あり
  • [雑誌論文] 学位に付記する専攻分野の名称とディプロマ・ポリシーの整合性に関する研究2022

    • 著者名/発表者名
      宮崎和光、高橋望、森利枝
    • 雑誌名

      電気学会論文誌C(電子・情報・システム部門誌)

      巻: 142 号: 2 ページ: 117-128

    • DOI

      10.1541/ieejeiss.142.117

    • NAID

      130008150248

    • ISSN
      0385-4221, 1348-8155
    • 年月日
      2022-02-01
    • 関連する報告書
      2021 実施状況報告書
    • 査読あり
  • [雑誌論文] Traffic Signal Control System Using Deep Reinforcement Learning With Emphasis on Reinforcing Successful Experiences2022

    • 著者名/発表者名
      Kodama Naoki、Harada Taku、Miyazaki Kazuteru
    • 雑誌名

      IEEE Access

      巻: 10 ページ: 128943-128950

    • DOI

      10.1109/access.2022.3225431

    • 関連する報告書
      2022 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Modeling of placebo effect in stochastic reward tasks by reinforcement learning2022

    • 著者名/発表者名
      Miyazaki Kazuteru
    • 雑誌名

      Procedia Computer Science

      巻: 213 ページ: 255-262

    • DOI

      10.1016/j.procs.2022.11.064

    • 関連する報告書
      2022 実施状況報告書
    • 査読あり
  • [雑誌論文] Home Energy Management Algorithm Based on Deep Reinforcement Learning Using Multistep Prediction2021

    • 著者名/発表者名
      Kodama Naoki、Harada Taku、Miyazaki Kazuteru
    • 雑誌名

      IEEE Access

      巻: 9 ページ: 153108-153115

    • DOI

      10.1109/access.2021.3126365

    • 関連する報告書
      2021 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Proposal and evaluation of deep exploitation-oriented learning under multiple reward environment2021

    • 著者名/発表者名
      Miyazaki Kazuteru
    • 雑誌名

      Cognitive Systems Research

      巻: 70 ページ: 29-39

    • DOI

      10.1016/j.cogsys.2021.07.002

    • 関連する報告書
      2021 実施状況報告書
    • 査読あり
  • [学会発表] Application of Deep Reinforcement Learning to Decentralized Control of Traffic Signals Considering Fairness in a Road Traffic Network Including Intersections Without Traffic Signals2024

    • 著者名/発表者名
      Shirasaka Shogo、Kodama Naoki、Harada Taku
    • 学会等名
      The 10th IEEJ International Workshop on Sensing, Actuation, Motion Control, and Optimization
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] Suppression of Negative Tweets using Reinforcement Learning Systems in a Multi-Agent Environment2023

    • 著者名/発表者名
      Miyazaki Kazuteru、Miyazaki Hitomi
    • 学会等名
      2023 Annual International Conference on Brain-Inspired Cognitive Architectures for Artificial Intelligence, the 14th Annual Meeting of the BICA Society (BICA*AI 2023)
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] Competencies to Be Cultivated in Higher Education and Their Evaluation in the Era of Generative AI: Through the Experiences With Self-Study Degree-Awarding Program in NIAD-QE2023

    • 著者名/発表者名
      Yamada Nodoka、Sakaguchi Kikue、Nakamura Yu、Miyazaki Kazuteru、Yamaguchi Shu
    • 学会等名
      The 15th Higher Education International Conference, ARTIFICIAL INTELLIGENCE AND PEDAGOGICAL TRANSFORMATION: IMPLICATIONS FOR HIGHER EDUCATION QUALITY ASSURANCE
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] Rule-based generation of synthetic genetic circuits2023

    • 著者名/発表者名
      Yamamura Masayuki、Sekine Ryoji、Miyazaki Kazuteru、Okuda Sota、Kodama Naoki、Kiga Daisuke
    • 学会等名
      15th International Workshop on Bio-Design Automation (IWBDA 2023)
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] 意識的意思決定システムのマルチエージェント環境下への拡張2023

    • 著者名/発表者名
      宮崎和光
    • 学会等名
      計測自動制御学会 システム・情報部門 学術講演会2023 (SSI2023)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 燃料消費および走行時間を考慮したハイブリッド自動車走行制御に対する深層強化学習の適用2023

    • 著者名/発表者名
      LI ZHAOXI、原田拓
    • 学会等名
      計測自動制御学会 システム・情報部門学術講演会2023 (SSI2023)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 機械学習手法を利用したBioDOS にとって有用な論文の発見2023

    • 著者名/発表者名
      宮崎和光、木賀大介、安田翔也、濱田立輝、小玉直樹、山村雅幸
    • 学会等名
      電気学会 システム/制御合同研究会
    • 関連する報告書
      2023 実績報告書
  • [学会発表] マルチエージェント環境下における強化学習を用いたネガティブツイートの抑制2023

    • 著者名/発表者名
      宮崎和光
    • 学会等名
      第50回知能システムシンポジウム
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] Effectiveness of Character-level CNN and its Examination of Perturbation for Weights2023

    • 著者名/発表者名
      Miyazaki Kazuteru、Ida Masaaki
    • 学会等名
      28th International Symposium on Artificial Life and Robotics (AROB 28th 2023)
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会
  • [学会発表] Learning Thresholds to Select Cooperative Partners by Applying Deep Reinforcement Learning in Distributed Traffic Signal Control2023

    • 著者名/発表者名
      Matsuta Shinya、Kodama Naoki、Harada Taku
    • 学会等名
      38th International Conference on Computers and Their Applications
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会
  • [学会発表] Distributed Traffic Signal Control with Fairness Using Deep Reinforcement Learning2023

    • 著者名/発表者名
      Shirasaka Shogo、Kodama Naoki、Harada Taku
    • 学会等名
      SICE International Symposium on Control Systems 2023
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会
  • [学会発表] 強化学習を用いたネガティブツイートの抑制2022

    • 著者名/発表者名
      宮崎和光
    • 学会等名
      計測自動制御学会 システム・情報部門 学術講演会2022
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 経験強化型深層強化学習による Atari2600 シミュレーション2022

    • 著者名/発表者名
      小玉直樹、原田拓、宮崎和光
    • 学会等名
      計測自動制御学会 システム・情報部門 学術講演会2022
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 説明可能な深層強化学習法の提案2022

    • 著者名/発表者名
      小玉直樹、原田拓、宮崎和光
    • 学会等名
      電気学会C部門大会
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 深層学習を利用したBioDOS にとって有用な論文の発見2022

    • 著者名/発表者名
      宮崎和光、木賀大介、安田翔也、濱田立輝、小玉直樹、山村雅幸
    • 学会等名
      電気学会C部門大会
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] Rule-based generation of synthetic genetic circuits2022

    • 著者名/発表者名
      Kiga Daisuke、Miyazaki Kazuteru、Yasuda Shoya、Hamada Ritsuki、Okuda Sota、Sekine Ryoji、Kodama Naoki、Yamamura Masayuki
    • 学会等名
      14th International Workshop on Bio-Design Automation (IWBDA 2022)
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会
  • [学会発表] Profit Sharing による方策の直接強化手法の提案2022

    • 著者名/発表者名
      小玉直樹、宮崎和光、原田拓
    • 学会等名
      第49回知能システムシンポジウム
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] Proposal and Evaluation of Deep Profit Sharing Method in a Mixed Reward and Penalty Environment2021

    • 著者名/発表者名
      Kazuteru Miyazaki
    • 学会等名
      2021 Annual International Conference on Brain-Inspired Cognitive Architectures for Artificial Intelligence
    • 関連する報告書
      2021 実施状況報告書
    • 国際学会
  • [学会発表] 状態遷移予測型Deep Q-Networkの提案2021

    • 著者名/発表者名
      小玉直樹、宮崎和光、原田拓
    • 学会等名
      計測自動制御学会 システム・情報部門 学術講演会2021
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 確率的報酬課題におけるプラセボ効果の強化学習によるモデル化2021

    • 著者名/発表者名
      宮崎和光
    • 学会等名
      計測自動制御学会 システム・情報部門 学術講演会2021
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 状態遷移予測型強化学習法の提案2021

    • 著者名/発表者名
      小玉直樹、宮崎和光、原田拓
    • 学会等名
      電気学会C部門大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 報酬と罰が混合する環境における深層経験強化型学習に関する一考察2021

    • 著者名/発表者名
      宮崎和光
    • 学会等名
      電気学会C部門大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 学位に付記する専攻分野の名称とディプロマ・ポリシーの整合性判定支援システムの性能改善2021

    • 著者名/発表者名
      宮崎和光、吉田望、森利枝
    • 学会等名
      電気学会 システム/制御 合同研究
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] Evaluation of Character-Level CNNs using the NTCIR-13 MedWeb Task2021

    • 著者名/発表者名
      Kazuteru Miyazaki、Masaaki Ida
    • 学会等名
      The 22nd International Symposium on Advanced Intelligent Systems
    • 関連する報告書
      2021 実施状況報告書
    • 国際学会
  • [学会発表] Character-level CNN の重みの摂動に関する一考察 - NTCIR-13 MedWeb タスクを題材として -2021

    • 著者名/発表者名
      宮崎和光、井田正明
    • 学会等名
      計測自動制御学会 システム・情報部門 学術講演会2021
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] NTCIR-13 MedWebタスクを用いたCharacter-level CNNの性能評価2021

    • 著者名/発表者名
      宮崎和光、井田正明
    • 学会等名
      電気学会C部門大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] Proposal for selecting a cooperation partner in distributed control of traffic signals using deep reinforcement learning2021

    • 著者名/発表者名
      Shinya Matsuta、Naoki Kodama、Taku Harada
    • 学会等名
      Proceedings of the 8th IIAE International Conference on Intelligent Systems and Image Processing 2021
    • 関連する報告書
      2021 実施状況報告書
    • 国際学会
  • [図書] 危機こそマネジメント改革の好機(第3部 第3章「研究者養成としての大学院教育」を山口周が執筆)2022

    • 著者名/発表者名
      川口昭彦 、栗田佳代子、山口周 、吉田塁、長谷川壽一(編集協力)、福田秀樹(編集協力)
    • 総ページ数
      172
    • 出版者
      株式会社ぎょうせい
    • 関連する報告書
      2021 実施状況報告書

URL: 

公開日: 2021-04-28   更新日: 2025-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi