2019 Fiscal Year Research-status Report

Proposal of new evaluation value for combinatorial optimization problem using deep learning

Research Project

Project/Area Number	18K11484
Research Institution	Kansai University
Principal Investigator	榎原博之関西大学, システム理工学部, 教授 (50194014)
Project Period (FY)	2018-04-01 – 2021-03-31
Keywords	深層学習 / 最適化 / 巡回セールスマン問題 / 近似解法 / 機械学習
Outline of Annual Research Achievements	近年、ディープラーニング（深層学習）が注目されており、様々な応用分野に利用されている。一方、組合せ最適化問題は応用範囲が広く、厳密解法だけでなく、近似解法、特にメタヒューリスティックスの研究が盛んである。本研究では、ユークリッド型組合せ最適化問題に対してディープラーニングを応用した近似解法を提案する。ランダムに生成した大量の問題例に対して最適解もしくは最良解を画像としてディープラーニングにより学習させ、出力として得られた画像データから評価値を算出する。学習により得られた評価値を従来の距離による評価値の代りにヒューリスティック解法に適用することにより、学習により得られた評価値の有効性を計算機実験により検証する。計算機実験の結果、提案手法は先行研究より優れた性能を示した。その成果は情報処理学会論文誌（Vol.60, No.2, pp.651-659, Feb. 2019）に掲載された。上記の手法は教師あり学習のため、大量の教師データが必要であり、大規模な問題例の教師データを大量に用意することは困難である。そこで、教師データを必要としない強化学習に注目して、報酬と学習方法を工夫し、計算機実験を行っている。この成果は、情報処理学会論文誌に投稿中である。さらに、学習方法を修正し、出力画像から各経路の評価値を算出するのでは無く、次に選ぶべき頂点座標を評価する手法を提案した。この手法は従来手法より解の局所的な点で優れていることを示した。この成果は、2019年11月にアメリカオレゴン州ポートランドで開催されたIEEE 31st International Conference on Tools with Artificial Intelligence (ICTAI)で発表している。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 本研究では、ユークリッド型組合せ最適化問題としてユークリッド巡回セールスマン問題を扱う。ユークリッド巡回セールスマン問題とは平面上にn個の点が与えられたとき、すべての点を通る巡回路の中で最も総距離の短い経路を求める問題である。巡回セールスマン問題（TSP）は、NP困難に属する組合せ最適化問題の中で最も良く研究されている問題の1つで、ウェブサイトTSPLIBにアルゴリズム比較・検証用の数多くの問題例が用意されている。さらに、小規模の問題例ならば、高性能なTSPソルバであるConcordeを利用して最適解を求めることができる。 2018年度には、2次元平面上にランダムに点を配置することにより20～100都市のユークリッド巡回セールスマン問題の問題例を20万個作成し、Concordeにより得られた最適経路の画像を教師データとして畳み込みニューラルネットワーク（CNN）を用いて学習した。しかし、学習に時間がかかり、大規模な問題では最適解を求めることが難しく、この方法で学習させることができない。そこで2019年度には、最適解を用いない教師無し学習、特に強化学習を検討した。Prioritized Experience Replay を適用し、解の生成時に各エッジを過去に選択した回数を考慮することで、解を多様性を維持し、学習の安定化を図った。その結果、半数以上の問題例で教師あり学習の従来手法を上回る結果を達成し、巡回セールスマン問題における強化学習の有効性を示した。
Strategy for Future Research Activity	本研究では、2018年度にディープラーニングを用いて、ユークリッド巡回セールスマン問題に対する近似解法を提案した。2019年度には、強化学習を用いて教師データ（最適解）を必要としない手法を提案した。いずれの手法も学習には大量の計算コストがかかるという問題点が存在する。そこで、高性能な学習済みモデルを利用する転移学習やファインチューニングを検討する。機械学習、特にディープラーニングが普及し、様々な分野で利用されている。現在、高性能な学習済みモデルはたくさん存在する。それらを利用すれば、一から学習するよりも簡単に高性能な学習済みモデルを構築できる可能性があると考える。本研究でもユークリッド巡回セールスマン問題に対するいくつかの学習済みモデルが存在する。それらのモデルを巡回セールスマン問題以外の問題、具体的には、頂点間の距離が短いものを優先するような問題に利用し、学習時間が短縮できることを示したい。
Causes of Carryover	予定していた消耗品の購入が必要なくなっため、次年度使用額が生じた。今年度は最終年度であるので、研究成果の公表に重点を置いて予算執行する。そのため、昨年度の残金と今年度の予算を併せて、論文掲載料と旅費に充当させる予定である。

Research Products
(2 results)

All Presentation (2 results) (of which Int'l Joint Research: 1 results)

[Presentation] Solving Traveling Salesman Problem with Image-based Classification2019
- Author(s)
  Shoma MIKI, Hiroyuki EBARA
- Organizer
  IEEE 31st International Conference on Tools with Artificial Intelligence (ICTAI), Portland, OR, USA
- Int'l Joint Research
[Presentation] 巡回セールスマン問題に対するファインチューニング2019
- Author(s)
  濱洲陵, 山本大輔, 三木彰馬, 榎原博之
- Organizer
  2019年電子情報通信学会基礎・境界ソサイエティ大会（N-1-16）, 大阪大学