研究課題/領域番号 |
20K11988
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61040:ソフトコンピューティング関連
|
研究機関 | 京都工芸繊維大学 |
研究代表者 |
飯間 等 京都工芸繊維大学, 情報工学・人間科学系, 准教授 (70273547)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2022年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2021年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2020年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
|
キーワード | 機械学習 / 深層学習 / 強化学習 / 深層強化学習 / 最適化 / 組合せ最適化 / モンテカルロ木探索 |
研究開始時の研究の概要 |
組合せ最適化はありとあらゆる分野、例えば生産、物流、通信ネットワーク、金融、土木、農業などの分野で用いられているが、多くの最適化問題は難解であり、短時間で最適な解を求める方法が存在しない。一方、囲碁やビデオゲームに対して、人間のプレイヤーより上手にプレイする機械学習技術が提案され、非常に注目を集めている。この機械学習は強化学習を深層学習と組み合わせたもので、深層強化学習と呼ばれている。本研究では、この深層強化学習の学習能力を活かした独創的な組合せ最適化法を開発する。また、機械学習の汎化能力を活かして、学習の大半を最初に一度だけ実行するだけで、種々の問題に対する解を短時間に得る方法を開発する。
|
研究成果の概要 |
短時間での最適解の発見が困難であることが知られる組合せ最適化問題に対して、囲碁やテレビゲームに対して提案されている深層強化学習に基づく最適化法を開発した。また、学習の大半を最初に一度だけ実行するだけで、他の問題に対する解を短時間に得る方法の基本的な枠組みを検討した。これらの解法を配送スケジューリング問題に適用する数値実験を行い、それらの性能を明らかにした。
|
研究成果の学術的意義や社会的意義 |
深層強化学習が学習問題に対して高い性能を示すことが知られているが、これを組合せ最適化法として構成し直すことにより、従来の方法とは一線を画す解法を開発できた。この解法を既存の最適化法と比較することにより、さらに優れた最適化法を開発することが期待できる。また、優れた最適化法を開発することで、生産、物流、通信ネットワーク、金融、交通、土木、農業などの多くの分野のシステム開発に寄与できる。
|