• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Developing explainable decision support systems for inventory management using deep reinforcement learning

Research Project

Project/Area Number 23K13514
Research Category

Grant-in-Aid for Early-Career Scientists

Allocation TypeMulti-year Fund
Review Section Basic Section 25010:Social systems engineering-related
Research InstitutionOkayama University

Principal Investigator

劉 子昂  岡山大学, 環境生命自然科学学域, 助教 (30908166)

Project Period (FY) 2023-04-01 – 2026-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥3,640,000 (Direct Cost: ¥2,800,000、Indirect Cost: ¥840,000)
Fiscal Year 2025: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2023: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Keywords在庫管理 / 強化学習 / 最適化 / 意思決定 / 説明可能なAI / 深層強化学習
Outline of Research at the Start

本研究では,深層強化学習を用いた在庫管理のための説明可能な意思決定支援システムを開発する.深層強化学習モデルが得られた在庫政策の判断根拠を示す手法,モデル全体の判断ロジックをルールと数式の形式で抽出する手法を明らかにする.その上で,システムの説明に基づいて人の知見を深層強化学習モデルに反映する手法を明らかにする.

Outline of Annual Research Achievements

初年度は、以下の研究内容に取り組んだ。
1. 在庫最適化問題の効率的な解法の開発: 機械学習アルゴリズムを用いて、在庫最適化問題の評価関数を近似するモデルを構築し、計算知能アルゴリズムを高速化する新たな手法を提案した。この手法は、在庫最適化問題に深層強化学習アルゴリズムを適用する際のベースラインとして有用である。
2. 需要の不確実性を考慮した在庫転送最適化: 深層強化学習手法の一つであるProximal Policy Optimization(PPO)を需要の不確実性を考慮した在庫転送最適化問題に適用した。数値実験の結果、PPOアルゴリズムによって得られた在庫政策が、最適方策とほぼ同等の性能を示すことが示された。
3. 在庫政策の自然言語での説明: 大規模言語モデルを活用し、強化学習手法によって得られた在庫政策を自然言語で説明する手法を提案した。この手法により、意思決定者に学習した在庫政策の判断根拠を説明することが可能となった。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

初年度において、在庫最適化問題への効率的な解法の開発、在庫転送最適化問題に深層強化学習を適用する方法、在庫政策の自然言語で説明する手法の提案を行なった。これらの成果の一部が、Expert Systems with ApplicationsやComplex & Intelligent Systemsなどの国際学術誌に掲載された。以上により、本年度の研究はおおむね順調に進展している。

Strategy for Future Research Activity

次年度は、以下の研究内容に取り組む予定である。
1. 初年度に提案した大規模言語モデルを活用した在庫政策の自然言語での説明手法をさらに発展させ、意思決定者が在庫政策を理解しやすい形式で提示できるようにする。
2. 大規模な在庫最適化問題における精密解法を開発する。

Report

(1 results)
  • 2023 Research-status Report
  • Research Products

    (3 results)

All 2024 2023

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 1 results) Presentation (1 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] Surrogate-assisted evolutionary optimization for perishable inventory management in multi-echelon distribution systems2024

    • Author(s)
      Liu Ziang、Nishi Tatsushi
    • Journal Title

      Expert Systems with Applications

      Volume: 238 Pages: 122179-122179

    • DOI

      10.1016/j.eswa.2023.122179

    • Related Report
      2023 Research-status Report
    • Peer Reviewed
  • [Journal Article] Data-driven evolutionary computation for service constrained inventory optimization in multi-echelon supply chains2023

    • Author(s)
      Liu Ziang、Nishi Tatsushi
    • Journal Title

      Complex & Intelligent Systems

      Volume: 10 Issue: 1 Pages: 825-846

    • DOI

      10.1007/s40747-023-01179-0

    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Presentation] Inventory Control with Lateral Transshipment Using Proximal Policy Optimization2023

    • Author(s)
      Liu Ziang、Nishi Tatsushi
    • Organizer
      2023 5th International Conference on Data-driven Optimization of Complex Systems (DOCS)
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research

URL: 

Published: 2023-04-13   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi