深層強化学習を用いた在庫管理のための説明可能な意思決定支援システム

研究課題

研究課題/領域番号	23K13514
研究種目	若手研究
配分区分	基金
審査区分	小区分25010:社会システム工学関連
研究機関	岡山大学
研究代表者	劉子昂岡山大学, 環境生命自然科学学域, 助教 (30908166)
研究期間 (年度)	2023-04-01 – 2026-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	3,640千円 (直接経費: 2,800千円、間接経費: 840千円) 2025年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円) 2024年度: 780千円 (直接経費: 600千円、間接経費: 180千円) 2023年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
キーワード	在庫管理 / 強化学習 / 最適化 / 意思決定 / 説明可能なAI / 深層強化学習
研究開始時の研究の概要	本研究では，深層強化学習を用いた在庫管理のための説明可能な意思決定支援システムを開発する．深層強化学習モデルが得られた在庫政策の判断根拠を示す手法，モデル全体の判断ロジックをルールと数式の形式で抽出する手法を明らかにする．その上で，システムの説明に基づいて人の知見を深層強化学習モデルに反映する手法を明らかにする．
研究実績の概要	初年度は、以下の研究内容に取り組んだ。 1. 在庫最適化問題の効率的な解法の開発: 機械学習アルゴリズムを用いて、在庫最適化問題の評価関数を近似するモデルを構築し、計算知能アルゴリズムを高速化する新たな手法を提案した。この手法は、在庫最適化問題に深層強化学習アルゴリズムを適用する際のベースラインとして有用である。 2. 需要の不確実性を考慮した在庫転送最適化: 深層強化学習手法の一つであるProximal Policy Optimization（PPO）を需要の不確実性を考慮した在庫転送最適化問題に適用した。数値実験の結果、PPOアルゴリズムによって得られた在庫政策が、最適方策とほぼ同等の性能を示すことが示された。 3. 在庫政策の自然言語での説明: 大規模言語モデルを活用し、強化学習手法によって得られた在庫政策を自然言語で説明する手法を提案した。この手法により、意思決定者に学習した在庫政策の判断根拠を説明することが可能となった。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由初年度において、在庫最適化問題への効率的な解法の開発、在庫転送最適化問題に深層強化学習を適用する方法、在庫政策の自然言語で説明する手法の提案を行なった。これらの成果の一部が、Expert Systems with ApplicationsやComplex & Intelligent Systemsなどの国際学術誌に掲載された。以上により、本年度の研究はおおむね順調に進展している。
今後の研究の推進方策	次年度は、以下の研究内容に取り組む予定である。 1. 初年度に提案した大規模言語モデルを活用した在庫政策の自然言語での説明手法をさらに発展させ、意思決定者が在庫政策を理解しやすい形式で提示できるようにする。 2. 大規模な在庫最適化問題における精密解法を開発する。

報告書

(1件)

2023 実施状況報告書

研究成果
(3件)

すべて 2024 2023

すべて雑誌論文 (2件) (うち査読あり 2件、オープンアクセス 1件) 学会発表 (1件) (うち国際学会 1件)

[雑誌論文] Surrogate-assisted evolutionary optimization for perishable inventory management in multi-echelon distribution systems2024
- 著者名/発表者名
  Liu Ziang、Nishi Tatsushi
- 雑誌名
  
  Expert Systems with Applications
  
  巻: 238 ページ: 122179-122179
- DOI
  10.1016/j.eswa.2023.122179
- 関連する報告書
  2023 実施状況報告書
- 査読あり
[雑誌論文] Data-driven evolutionary computation for service constrained inventory optimization in multi-echelon supply chains2023
- 著者名/発表者名
  Liu Ziang、Nishi Tatsushi
- 雑誌名
  
  Complex & Intelligent Systems
  
  巻: 10 号: 1 ページ: 825-846
- DOI
  10.1007/s40747-023-01179-0
- 関連する報告書
  2023 実施状況報告書
- 査読あり / オープンアクセス
[学会発表] Inventory Control with Lateral Transshipment Using Proximal Policy Optimization2023
- 著者名/発表者名
  Liu Ziang、Nishi Tatsushi
- 学会等名
  2023 5th International Conference on Data-driven Optimization of Complex Systems (DOCS)
- 関連する報告書
  2023 実施状況報告書
- 国際学会

深層強化学習を用いた在庫管理のための説明可能な意思決定支援システム

研究代表者

劉 子昂 岡山大学, 環境生命自然科学学域, 助教 (30908166)

3,640千円 (直接経費: 2,800千円、間接経費: 840千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] Surrogate-assisted evolutionary optimization for perishable inventory management in multi-echelon distribution systems2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Data-driven evolutionary computation for service constrained inventory optimization in multi-echelon supply chains2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] Inventory Control with Lateral Transshipment Using Proximal Policy Optimization2023

著者名/発表者名

学会等名

関連する報告書

劉子昂岡山大学, 環境生命自然科学学域, 助教 (30908166)