2023 Fiscal Year Annual Research Report
High-Performance Optimization Algorithm based on Machine Learning and Search
Project/Area Number |
20H04251
|
Allocation Type | Single-year Grants |
Research Institution | Kyushu University |
Principal Investigator |
美添 一樹 九州大学, 情報基盤研究開発センター, 教授 (80449115)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Keywords | グラフ探索 / 並列アルゴリズム / 機械学習 / 化合物探索 / 組合せ最適化 |
Outline of Annual Research Achievements |
引き続き、探索と機械学習による最適化アルゴリズムの研究に取り組んでいる。今年度では特に、長時間の計算を必要とする評価指標(量子計算シミュレーション等)を用いた場合に、大規模並列計算機(スーパーコンピュータ)上で効率良く動作するアルゴリズムの開発に取り組んだ。 昨年度までの成果として、グラフ探索アルゴリズムと機械学習を用いた化合物探索のためのツール ChemTSv2 を公開している。この基本となるアルゴリズムは、数ミリ秒で計算可能な軽量な評価関数から、数分以上の計算時間がかかる重い評価関数まで対応することを目標として設計されていた。軽量な物の代表例は機械学習モデル、重い物の代表例は計算化学シミュレーション等である。しかし重い評価関数を使った場合に実行効率が落ちることが観測されたため、グラフ探索の並列化に関する部分のアルゴリズムに修正を加え、効率の改良を試みた。既に実装は終了し性能はある程度確認されており、今後論文発表を行う予定である。 この点の改良は、多彩な評価関数を用いて最適化を行う場合、化合物以外の問題を視野に入れる場合に貢献する。特に、GPUを多く必要とする大規模言語モデル (LLM) などの生成AIを評価指標として用いる探索手法は多くの研究者の興味を集めているが、LLMを探索に用いることはそれほど容易ではなく、我々の研究が重要な貢献をすると期待できる。 現在公開しているツールは化合物探索専用の実装となっているが、今年度の研究成果を元に今後さらに応用範囲を広げることを計画している。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
全5年計画のうち4年目まで終了した段階だが、探索アルゴリズムの理論とスーパーコンピュータを用いた並列アルゴリズムを軸に機械学習やシミュレータを組み合わせ、実際に化合物探索で有用な成果を得ている。既に実問題で有望な成果を得ていることで計画の主目的は、少なくとも一つの分野では達成されたと言える。 その成果として開発したソフトウェアは、現在は化合物探索専用の実装となっているが、他の分野に適用することは容易であり、今後は多くの分野に適用することが有望である。機械学習と探索の組み合わせは、生成AIの発展を背景にますます有用性が増している。しかし機械学習側の進歩と比較して、それと探索を併用する際の研究は大きく不足している。申請者らの得ているアルゴリズムの理論面、実装面の知見は、今後多くの分野に貢献すると期待できる。
|
Strategy for Future Research Activity |
上述の様に、現在は機械学習やシミュレータとグラフ探索を組み合わせたツールを、スーパーコンピュータ上で大規模並列実行を行うアルゴリズムを開発しており、化合物探索では既に新規化合物の発見に成功するなど有望な成果を得ている。今後更に性能を改良し、汎用性を増すことで多くの分野に貢献することを計画している。 具体的には、動作環境や実行時間が異なる多くの評価指標を用いて効率良く動作するアルゴリズムの確率が上げられる。現在でも特定のいくつかの組み合わせでは良好な性能が実証されているが、今後は成果指標としてさらに多彩な計算が求められる。たとえばCPUで動作する軽量な評価関数から、長時間の実行を必要とするシミュレーション、さらに高性能なGPU上での動作が必要とされる機械学習モデルまで、全てを併用しての探索手法の実現が重要となる。今年度の成果を足がかりとしてこの目標に取り組む。現在目標としている適用分野は複数あるが、短期的な目標はさらに幅広い化合物の探索や、自然言語処理に関係した分野への適用などが主である。 さらに、残る研究期間で応用範囲の拡大に加えて、探索との組み合わせに適した機械学習モデルの開発、探索の結果をフィードバックした機械学習モデルの改良、軽量・不正確な評価関数と重く・正確な評価関数が混在した状況での探索アルゴリズムの開発などに取り組む計画である。
|