研究課題/領域番号 |
21K12030
|
研究機関 | 大阪大学 |
研究代表者 |
間下 以大 大阪大学, サイバーメディアセンター, 准教授 (00467606)
|
研究分担者 |
李 天鎬 岡山理科大学, 総合情報学部, 教授 (70792737)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | Bin Packing 問題 / 深層強化学習 |
研究実績の概要 |
Bin Packing問題とは,いくつかの荷物をContainerの中に詰め込む時,Container内の稠密度を最大とするためにはどのような詰め込み方をするとよいかを求める問題のことである.現実問題におけるPackingを考えた時,3次元のBin Packing問題は非常に複雑であり,現実的な時間内に厳密解を求めることができない.そのため,ヒューリスティックな手法をはじめとし,遺伝的アルゴリズムや深層強化学習を用いた手法など様々な近似解法が提案されている.特に深層強化学習を用いた手法は高い精度を示しており,人手による詰め込みを上回る精度の詰め込みが期待されている.しかし深層強化学習によるBin Packing問題の学習は,その問題の複雑さから非常に大きな計算コストを必要とし,様々な条件が求められるBin Packing問題において小さなインスタンスのみによる研究が主となっている.深層強化学習の学習過程の効率化はより大きなインスタンス,または複雑な制約にもとづくBin Packing問題への適用を簡単にし,より現実問題に則したBin Packing問題への深層強化学習の適用を可能とする.本研究では深層強化学習を用いたBin Packing問題の解法においてヒューリスティックな手法による探索範囲の制限を取り入れる手法の提案を行った.Container内のすべての空間について探索を行わず,Bottom-Left法やBest-Fit法といった考えを適用することにより解の候補を事前に提示する.これにより解の精度を保ちつつ,探索空間が大幅に減少し,効率的な学習及び計算コストの削減の効果があることを示した. この研究成果は国際会議,International Symposium on Grids & Clouds (ISGC) 2023にて発表を行なった.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2年目で取り組む予定であったエンコーディング/デコーディングの開発は停滞したものの,3年目に取り組む予定であった深層強化学習を既存手法を参考に導入したため,総合的に順調に進展している
|
今後の研究の推進方策 |
3年目は,1年目に開発した遺伝的アルゴリズムと物理シミュレーションによる解の動的評価を深層強化学に取り入れる.これによって,学習途中の状態の評価を行い,効率的かつコンテナの揺れに頑健なパッキング手順の生成手法を開発する.
|
次年度使用額が生じた理由 |
GPUを含む計算機については,過去の研究で使用したものがまだ利用可能であったため,それを利用した.今後も新たなGPUが発表されると予想でき,適宜必要な時期に現在よりも高性能なものを購入する.
|