研究課題/領域番号 |
23K20387
|
補助金の研究課題番号 |
20H04251 (2020-2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2020-2023) |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 九州大学 |
研究代表者 |
美添 一樹 九州大学, 情報基盤研究開発センター, 教授 (80449115)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
17,680千円 (直接経費: 13,600千円、間接経費: 4,080千円)
2024年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
2023年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
2022年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
2021年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
2020年度: 8,190千円 (直接経費: 6,300千円、間接経費: 1,890千円)
|
キーワード | 探索アルゴリズム / 機械学習 / 化合物探索 / データマイニング / 並列計算 / グラフ探索 / 並列アルゴリズム / 組合せ最適化 / 並列化 / 探索 / 最適化 / 高性能計算 |
研究開始時の研究の概要 |
機械学習手法の発展によって従来数値で表せなかった様々なデータが計算機で効率良く処理できるようになっている。進歩した機械学習モデルを用いて最適化や探索を行うことによって、さらに多くの分野で実問題を解くことが可能となりつつある。機械学習手法単独での研究は盛んに行われているが、探索アルゴリズムと組み合わせた場合の研究は世界的に不足している。本研究では機械学習と探索アルゴリズムを組み合わせて、汎用性が高く高性能な最適化手法を開発することにより、多くの実問題に適用可能なソルバーの実現へ繋げることを目指す。
|
研究実績の概要 |
引き続き、探索と機械学習による最適化アルゴリズムの研究に取り組んでいる。今年度では特に、長時間の計算を必要とする評価指標(量子計算シミュレーション等)を用いた場合に、大規模並列計算機(スーパーコンピュータ)上で効率良く動作するアルゴリズムの開発に取り組んだ。 昨年度までの成果として、グラフ探索アルゴリズムと機械学習を用いた化合物探索のためのツール ChemTSv2 を公開している。この基本となるアルゴリズムは、数ミリ秒で計算可能な軽量な評価関数から、数分以上の計算時間がかかる重い評価関数まで対応することを目標として設計されていた。軽量な物の代表例は機械学習モデル、重い物の代表例は計算化学シミュレーション等である。しかし重い評価関数を使った場合に実行効率が落ちることが観測されたため、グラフ探索の並列化に関する部分のアルゴリズムに修正を加え、効率の改良を試みた。既に実装は終了し性能はある程度確認されており、今後論文発表を行う予定である。 この点の改良は、多彩な評価関数を用いて最適化を行う場合、化合物以外の問題を視野に入れる場合に貢献する。特に、GPUを多く必要とする大規模言語モデル (LLM) などの生成AIを評価指標として用いる探索手法は多くの研究者の興味を集めているが、LLMを探索に用いることはそれほど容易ではなく、我々の研究が重要な貢献をすると期待できる。 現在公開しているツールは化合物探索専用の実装となっているが、今年度の研究成果を元に今後さらに応用範囲を広げることを計画している。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
全5年計画のうち4年目まで終了した段階だが、探索アルゴリズムの理論とスーパーコンピュータを用いた並列アルゴリズムを軸に機械学習やシミュレータを組み合わせ、実際に化合物探索で有用な成果を得ている。既に実問題で有望な成果を得ていることで計画の主目的は、少なくとも一つの分野では達成されたと言える。 その成果として開発したソフトウェアは、現在は化合物探索専用の実装となっているが、他の分野に適用することは容易であり、今後は多くの分野に適用することが有望である。機械学習と探索の組み合わせは、生成AIの発展を背景にますます有用性が増している。しかし機械学習側の進歩と比較して、それと探索を併用する際の研究は大きく不足している。申請者らの得ているアルゴリズムの理論面、実装面の知見は、今後多くの分野に貢献すると期待できる。
|
今後の研究の推進方策 |
上述の様に、現在は機械学習やシミュレータとグラフ探索を組み合わせたツールを、スーパーコンピュータ上で大規模並列実行を行うアルゴリズムを開発しており、化合物探索では既に新規化合物の発見に成功するなど有望な成果を得ている。今後更に性能を改良し、汎用性を増すことで多くの分野に貢献することを計画している。 具体的には、動作環境や実行時間が異なる多くの評価指標を用いて効率良く動作するアルゴリズムの確率が上げられる。現在でも特定のいくつかの組み合わせでは良好な性能が実証されているが、今後は成果指標としてさらに多彩な計算が求められる。たとえばCPUで動作する軽量な評価関数から、長時間の実行を必要とするシミュレーション、さらに高性能なGPU上での動作が必要とされる機械学習モデルまで、全てを併用しての探索手法の実現が重要となる。今年度の成果を足がかりとしてこの目標に取り組む。現在目標としている適用分野は複数あるが、短期的な目標はさらに幅広い化合物の探索や、自然言語処理に関係した分野への適用などが主である。 さらに、残る研究期間で応用範囲の拡大に加えて、探索との組み合わせに適した機械学習モデルの開発、探索の結果をフィードバックした機械学習モデルの改良、軽量・不正確な評価関数と重く・正確な評価関数が混在した状況での探索アルゴリズムの開発などに取り組む計画である。
|