研究課題/領域番号 |
19K04904
|
研究機関 | 名古屋工業大学 |
研究代表者 |
中出 康一 名古屋工業大学, 工学(系)研究科(研究院), 教授 (50207825)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | マルコフ決定過程 / 強化学習 / 生産 / 発注 |
研究実績の概要 |
マルコフ決定過程や強化学習に関する応用と近似最適化についておこなった. コンビニにおける発注の利益最大化問題では,発注を1日2回と3回の場合に分け,それぞれの場合について在庫量,発注残などシステムの状態に応じた最適な発注量を求める問題について,マルコフ決定過程により定式化し,各状態に対する最適な発注量,利益等の比較をおこなった.またSDGs の観点から,CO2排出量等の要素を考慮したコスト構造により発注の回数による最適政策の比較をおこなった.CO2の排出量に対するコストが少ない場合は,3回の発注のほうがきめ細かく対応できるため,利益をより多くもたらすが,このコストが多くなると1日2回までの発注で,ある程度まとめて発注する方が望ましいことがわかった.なお,以前の研究で示された線形計画法を用いた近似解法について適用を試みたが近似解が得られなかった.この点について今後研究課題である. また,生産・販売からなるサプライチェインの各工程の発注・生産にかんする最適化問題について強化学習による近似最適化を試みた.近年見られるオンライン需要と,店舗販売の両方を考慮し,それぞれの発注量と,生産工程における1日の生産数について,状態を考慮した最適に近い政策について議論した.コストとして,平均費用だけでなく,各期費用と平均費用のばらつきも評価規範に取り入れ,この表記規範のもとで最適に近い政策を得る方法をを試みた,最適政策と比べ,強化学習モデルの方が販売者からの発注量に変化が見られ,最適政策には近くなるものの,数パーセント程度の差が見られた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
マルコフ決定過程の応用に関する研究はいくつか行ってきたが,近似最適化アルゴリズムに関する十分な成果が得られているとは言えず,今後さらに検討する必要がある.
|
今後の研究の推進方策 |
最適政策の近似最適化手法を中心に,これまでよりヒントとなる研究分野の範囲を広げて,検討する.本年度の手法で述べた費用のばらつきを考慮した最適化問題に関する近似最適化についても今後研究を深める.
|
次年度使用額が生じた理由 |
海外での論文発表の機会が少ないため国際会議関連の旅費等の費用が少なくなった. 本年度も国内外の会議等への参加,講演をおこなう.必要なソフトウエアの更新整備をおこなう.
|