Combinatorial Optimizer Based on Deep Reinforcement Learning
Project/Area Number |
20K11988
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 61040:Soft computing-related
|
Research Institution | Kyoto Institute of Technology |
Principal Investigator |
IIMA Hitoshi 京都工芸繊維大学, 情報工学・人間科学系, 准教授 (70273547)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Project Status |
Completed (Fiscal Year 2022)
|
Budget Amount *help |
¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2022: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2021: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2020: ¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
|
Keywords | 機械学習 / 深層学習 / 強化学習 / 深層強化学習 / 最適化 / 組合せ最適化 / モンテカルロ木探索 |
Outline of Research at the Start |
組合せ最適化はありとあらゆる分野、例えば生産、物流、通信ネットワーク、金融、土木、農業などの分野で用いられているが、多くの最適化問題は難解であり、短時間で最適な解を求める方法が存在しない。一方、囲碁やビデオゲームに対して、人間のプレイヤーより上手にプレイする機械学習技術が提案され、非常に注目を集めている。この機械学習は強化学習を深層学習と組み合わせたもので、深層強化学習と呼ばれている。本研究では、この深層強化学習の学習能力を活かした独創的な組合せ最適化法を開発する。また、機械学習の汎化能力を活かして、学習の大半を最初に一度だけ実行するだけで、種々の問題に対する解を短時間に得る方法を開発する。
|
Outline of Final Research Achievements |
We have developed optimizers based on deep reinforcement learning for solving combinatorial optimization problems, which are known to be challenging to find optimal solutions in a short time. These optimizers are classified into two types: Go and video games. We have also studied the basic framework of a method that can find a solution for a new instance in a short time after pre-training for another instance. These methods were applied to a delivery scheduling problem, and their performance was investigated experimentally.
|
Academic Significance and Societal Importance of the Research Achievements |
深層強化学習が学習問題に対して高い性能を示すことが知られているが、これを組合せ最適化法として構成し直すことにより、従来の方法とは一線を画す解法を開発できた。この解法を既存の最適化法と比較することにより、さらに優れた最適化法を開発することが期待できる。また、優れた最適化法を開発することで、生産、物流、通信ネットワーク、金融、交通、土木、農業などの多くの分野のシステム開発に寄与できる。
|
Report
(4 results)
Research Products
(9 results)