配送先の配置など問題パターンは現場によって異なる。高度に洗練された先端的最適化手法は却ってこれらに柔軟に対応できない。TSPLIBによる距離最小の最適化性能の評価でも、世界トップのLKHでさえ弱い問題パターンがある。この解決のため、多点探索特性を利用して長期的に得られる報酬を最大化する強化学習型の遺伝的アルゴリズム(GA)を明確化した。また、これらのGAの各個体の多様性や進化・停滞状態を数理的に表現するためにエントロピーを定義し、GAの進化に必要な各個体の多様性の計測方法に関し理論的に整理した。しかしパラメータが多すぎるなど制御に限界があり専門家レベルの精度に達しなかった。 一方、配送毎の巡回先の変動は1-2割程度以下のため、前例・事例の活用により探索効率が向上、進化の停滞の解決が可能なことが分った。しかも、実用上は人間的制約(順路の大幅/頻繁な変更は好まれず、数値化・明示化が難しいプライベートで質的な制約も少なくない)や社会的制約(同じ町・丁目・村が先など)の考慮も不可欠なことが更に明確になった。 以上、GAやLKHなど最適化技術の進展は顕著だが、問題パターンにより性能不十分かつ人間・社会的絡みや文化的多様性の配慮も困難で実用の障害となっている。しかし、この研究過程で、最終の26年度後半には、「人類は一からとかランダム(偶然)だけでなく、多種優良事例を漸進的かつ自律的分散的に改良し、多様な最適尺度で選択し文化として引継ぎ進化する」という分散多様最適・漸進的・文化遺伝子的進化の着想を得た。問題パターンによるがLKHと比べ距離最短だけでなく巡回順の破壊率を約半減などその効果を一部実証し、IEEEなど一流国際学会に査読付き論文を5編発表した。本着想は27年度からの科研費の研究課題に採択されており、さらなる研究展開を図る。
|