2022 Fiscal Year Research-status Report
大規模データに基づく機会制約問題の解と分離超平面の同時最適化
Project/Area Number |
22K12187
|
Research Institution | Kindai University |
Principal Investigator |
田川 聖治 近畿大学, 情報学部, 教授 (50252789)
|
Project Period (FY) |
2022-04-01 – 2026-03-31
|
Keywords | 機械学習 / 最適化手法 / 機会制約問題 |
Outline of Annual Research Achievements |
従来の機会制約問題(CCP)において、不確実性は既知の確率分布に従う確率変数としてモデル化される。ここで、確率変数を含む制約条件の値も確率変数となるが、通常、その確率分布を解析的に導出することは不可能である。このため、モンテカルロ法により生成した不確実性の擬似データから、制約条件が満たされる確率を推定する。従来のCCPの定式化の問題点として、確率分布による不確実性のモデル化誤差がある。近年、様々な分野でビッグデータと呼ばれる膨大なデータが蓄積され、その有効な活用方法が模索されている。そこで、不確実性の確率分布(モデル)に代えて、その標本空間を大規模データで与えるデータ駆動型CCP が注目されている。しかし、各データが制約条件を満たすか否かの判定には大きな計算負荷を要する場合が多く、利用可能な全データに対して実行可能性を評価することは現実的でない。このため、大規模データからサンプリングした標本セットを用いて、制約条件が満たされる比率を統計的に推定する。この様なデータ駆動型CCPの問題点として、大規模データから抽出された一部のデータしか使用されない。本研究では、制約条件を満たすか否かで大規模データを2クラスに分類することで、CCP を混合整数計画問題として定式化する。これにより、すべてのデータを利用してCCPの制約条件が満たされる比率を評価できるとともに、個々のデータについて制約条件を満たすか否かを判定できる。ここで、大規模データのクラス分けにはサポートベクトルマシン(SVM)を使用する。しかし、新たに提案するデータ駆動型CCPの定式化と解法では、CCPの実行可能な最適解の探索と、SVMの学習を同時に実行する必要がある。そこで、CCPの最適解の探索に進化計算を用いるとともに、その進化計算と連動させるSVMの教師データの生成法と学習アルゴリズムについて検討した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の計画通り、大規模データに基づく機会制約問題(CCP)を混合整数計画問題に定式化し、進化計算と機械学習を組み合わせた解法を提案した。進化計算には適応型差分進化アルゴリズムを採用した。また、大規模データを2クラスに分割する機械学習の技法には、サポートベクトルマシン(SVM)を使用した。ここで、SVMの性能は教師データに左右されるため、不均衡な大規模データから教師データをサンプリングする手法として、主成分分析に基づく空間層化抽出法と、2段階無作為抽出法を提案した。さらに、人工的に生成した2次元の大規模データにおいて、それらのサンプリング手法の有効性を確認した。また、進化計算と機械学習を組み合わせた最適化手法の有効性を検証するため、端末の位置の大規模データから基地局の最適な設置場所を決める基地局配置問題をデータ駆動型CCP(混合整数計画問題)として定式化した。さらに、その基地局配置問題(混合整数計画問題)において、提案した最適化手法の性能を評価した。その他、融資を利用した分散投資問題をCCPとして定式化し、そのCCPの特性を理論的に解析するとともに、差分進化アルゴリズムを拡張した最適化手法を提案している。
|
Strategy for Future Research Activity |
高次元の大規模データを対象としたサポートベクトルマシン(SVM)の学習方法の開発に取り組む。まず、提案している主成分分析に基づく空間層化抽出法では、高次元の大規模データから均等に教師データをサンプリングすることが困難である。そこで、2段階無作為抽出法を改良して高次元の大規模データにも有効な教師データのサンプリング手法を考案する。次に、進化計算と機械学習を組み合わせた最適化手法では、SVMの学習が繰り返し実行されることに着目し、学習の結果から得られるサポートベクトルの情報を利用したSVMの逐次型学習アルゴリズムを考案する。さらに、データ駆動型CCPの決定変数とSVMのパラメータ(カーネルや正則化係数)を同時に最適化するような最適化手法の構成法について検討する。その他、実世界の問題を対象としたデータ駆動型CCPの応用例の調査を引き続き行う。
|
Causes of Carryover |
価格の高騰で予定していた計算機が購入できず設備施設費を使用しなかった。新型コロナウィルス感染防止対策の緩和により、多くの学会が対面で実施されるようになったため、次年度に持ち越す研究費は、学会発表のための旅費として使用する予定である。
|