• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Annual Research Report

深層強化学習を用いた土壌熱交換システムの最適運用・制御手法の構築とその検証

Research Project

Project/Area Number 19H02301
Research InstitutionThe University of Kitakyushu

Principal Investigator

白石 靖幸  北九州市立大学, 国際環境工学部, 教授 (50302633)

Co-Investigator(Kenkyū-buntansha) 龍 有二  北九州市立大学, 国際環境工学部, 教授 (20191695)
長谷川 兼一  秋田県立大学, システム科学技術学部, 教授 (50293494)
永原 正章  北九州市立大学, 環境技術研究所, 教授 (90362582)
Project Period (FY) 2019-04-01 – 2022-03-31
Keywords強化学習 / DQN / 土壌熱交換 / 非定常CFD解析 / 空気質 / 省エネルギー
Outline of Annual Research Achievements

本研究では、土壌熱交換システム(地下ピット方式)を対象に省エネ効果の確保と結露発生の抑制を目指して、強化学習による最適制御則の構築を行ってきた。しかし、強化学習は学習の収束に膨大な試行回数を要するという問題があり、計算負荷を低減した非定常CFD解析を学習環境として用いたとして、通常、制御則を構築するのは困難である。このため、今年度は、本課題に対して、主に3つの解決策を提案し、それらの有効性を数値解析により検証した。一つ目の試みとして、環境側の簡易な予測モデルを作成し、その予測モデルに基づいて即時報酬を最大化するように行動を選択し、学習を進める手法を提案した。これにより、制御則の構築に要するエピソード数が10分の1程度に削減された。更に類似した手法として、計算負荷を低減した非定常CFD解析の結果を教師データとして、機械学習(主にランダムフォレスト)を用いてCFD解析を模倣する予測モデルを構築した。このモデルを強化学習の学習環境に用いることで、従来の解析手法と比較して大幅に計算時間を削減することが可能となった。教師データを作成する時間を除くと、計算時間の削減率は99%以上となった。最後に、学習の高速化や学習性能の向上を目指し、事前に学習したモデル(制御則)を新たな環境での学習に再利用する転移学習を導入した。これにより、高い制御性能を維持しつつ、エピソード数の削減が可能となった。特に、強化学習の収束性を高めるためには、転移元と転移先の類似度が重要であることが示唆された。
その他、これまでの主な研究成果である「夏季実測調査と非定常CFD 解析に基づいた地下ピット内空気環境の実態把握」や「方策ベース強化学習アルゴリズムであるPPO(Proximal Policy Optimization)を用いた運用制御」等の査読論文化を進めた。

Research Progress Status

令和3年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

令和3年度が最終年度であるため、記入しない。

  • Research Products

    (12 results)

All 2022 2021 Other

All Int'l Joint Research (1 results) Journal Article (3 results) (of which Peer Reviewed: 3 results,  Open Access: 2 results) Presentation (8 results) (of which Int'l Joint Research: 2 results)

  • [Int'l Joint Research] KU Leuven(ベルギー)

    • Country Name
      BELGIUM
    • Counterpart Institution
      KU Leuven
  • [Journal Article] 土壌熱交換システムの長期運用に伴う予冷・予熱特性(その2):夏季実測調査とCFD 解析による地下ピット内空気環境の実態把握2022

    • Author(s)
      平田一馬,白石靖幸,塘田研仁,長谷川兼一
    • Journal Title

      日本建築学会環境系論文集

      Volume: 87 Pages: 94-103

    • DOI

      10.3130/aije.87.94

    • Peer Reviewed / Open Access
  • [Journal Article] Proximal Policy Optimizationによる土壌熱交換システムの運用制御2022

    • Author(s)
      平田一馬,白石靖幸,塘田研仁,長谷川兼一
    • Journal Title

      空気調和・衛生工学会論文集

      Volume: 47 Pages: 27-36

    • Peer Reviewed
  • [Journal Article] 強化学習による土壌熱交換システムの運用制御(その1):反事実の報酬を考慮したアルゴリズムの適用可能性の検証2021

    • Author(s)
      塘田研仁,白石靖幸
    • Journal Title

      日本建築学会環境系論文集

      Volume: 86 Pages: 708-718

    • DOI

      10.3130/aije.86.708

    • Peer Reviewed / Open Access
  • [Presentation] Optimal Control of Earth-to-Air Heat Exchanger System Using Reinforcement Learning2021

    • Author(s)
      Kento Tomoda, Yasuyuki Shiraishi, Dirk Saelens
    • Organizer
      Building Simulation 2021 Conference
    • Int'l Joint Research
  • [Presentation] Numerical Prediction of Dew Condensation in EAHE System in Summer2021

    • Author(s)
      Kazuma Hirata, Kento Tomoda, Yasuyuki Shiraishi
    • Organizer
      Building Simulation 2021 Conference
    • Int'l Joint Research
  • [Presentation] 強化学習による土壌熱交換システムの最適制御,その5 反事実の報酬を考慮した報酬設計の有効性の検証2021

    • Author(s)
      塘田研仁,白石靖幸
    • Organizer
      日本建築学会大会
  • [Presentation] 強化学習による土壌熱交換システムの最適制御,その 6 ランダムフォレストを用いたピット内温湿度環境予測手法の開発2021

    • Author(s)
      香山拓生,塘田研仁,白石靖幸
    • Organizer
      日本建築学会大会
  • [Presentation] 先導的な教育及び環境配慮技術を導入した学校建築の環境評価,(その5)外気導入経路の違いによるクールヒートピットの予冷効果2021

    • Author(s)
      平田一馬,白石靖幸,平川聡,丸山純
    • Organizer
      日本建築学会大会
  • [Presentation] 強化学習による土壌熱交換システムの制御手法の提案,(第1報)反事実報酬を組み込んだMulti Discrete Action環境への実装2021

    • Author(s)
      塘田研仁,香山拓生,白石靖幸
    • Organizer
      空気調和・衛生工学会大会
  • [Presentation] 強化学習による土壌熱交換システムの制御手法の提案,(第2報)ランダムフォレストを用いたピット内温湿度環境予測手法の開発2021

    • Author(s)
      香山拓生,塘田研仁,白石靖幸
    • Organizer
      空気調和・衛生工学会大会
  • [Presentation] 強化学習による土壌熱交換システムの運用制御,-転移学習との併用による学習高速化に関する検討-2021

    • Author(s)
      平田一馬,白石靖幸
    • Organizer
      空気調和・衛生工学会九州支部 第5回 学術・技術交流会/学術技術発表会

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi