2023 Fiscal Year Research-status Report
Developing explainable decision support systems for inventory management using deep reinforcement learning
Project/Area Number |
23K13514
|
Research Institution | Okayama University |
Principal Investigator |
劉 子昂 岡山大学, 環境生命自然科学学域, 助教 (30908166)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Keywords | 在庫管理 / 強化学習 / 最適化 / 意思決定 / 説明可能なAI |
Outline of Annual Research Achievements |
初年度は、以下の研究内容に取り組んだ。 1. 在庫最適化問題の効率的な解法の開発: 機械学習アルゴリズムを用いて、在庫最適化問題の評価関数を近似するモデルを構築し、計算知能アルゴリズムを高速化する新たな手法を提案した。この手法は、在庫最適化問題に深層強化学習アルゴリズムを適用する際のベースラインとして有用である。 2. 需要の不確実性を考慮した在庫転送最適化: 深層強化学習手法の一つであるProximal Policy Optimization(PPO)を需要の不確実性を考慮した在庫転送最適化問題に適用した。数値実験の結果、PPOアルゴリズムによって得られた在庫政策が、最適方策とほぼ同等の性能を示すことが示された。 3. 在庫政策の自然言語での説明: 大規模言語モデルを活用し、強化学習手法によって得られた在庫政策を自然言語で説明する手法を提案した。この手法により、意思決定者に学習した在庫政策の判断根拠を説明することが可能となった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
初年度において、在庫最適化問題への効率的な解法の開発、在庫転送最適化問題に深層強化学習を適用する方法、在庫政策の自然言語で説明する手法の提案を行なった。これらの成果の一部が、Expert Systems with ApplicationsやComplex & Intelligent Systemsなどの国際学術誌に掲載された。以上により、本年度の研究はおおむね順調に進展している。
|
Strategy for Future Research Activity |
次年度は、以下の研究内容に取り組む予定である。 1. 初年度に提案した大規模言語モデルを活用した在庫政策の自然言語での説明手法をさらに発展させ、意思決定者が在庫政策を理解しやすい形式で提示できるようにする。 2. 大規模な在庫最適化問題における精密解法を開発する。
|