研究課題/領域番号 |
22K12046
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60090:高性能計算関連
|
研究機関 | 筑波大学 |
研究代表者 |
二村 保徳 筑波大学, システム情報系, 准教授 (30736210)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2023年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2022年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | 再現可能並列性 / スペクトラルアルゴリズム / 固有値解析 / グラフ解析 / 固有値計算 / 数値線形代数 / 並列計算 |
研究開始時の研究の概要 |
本研究課題では、並列計算機上で性能を発揮するグラフ(ネットワーク)解析の高速アルゴリズムを開発する。グラフ分割、コミュニティ検出、異常検知等で活用されるスペクトラルグラフアルゴリズムは、スペクトラルグラフ理論に支えられた理論基盤があり、その有効性が知られている。しかしながら、それらのアルゴリズムはマルチレベル法などの離散型ヒューリスティックに対し速度の面で優位となる場面が限定的であった。本課題では、代表者らが新たに開発した高速化手法を拡張・高度化し、近年重要視されつつある、解析結果が再現可能な並列化を指向した高性能アルゴリズムを構築する。
|
研究実績の概要 |
スペクトラルグラフ解析手法は、グラフから定義される各種行列(グラフラプラシアン等)の固有空間に基づき、各種のグラフ解析タスクを行う手法である。本手法はスペクトラルグラフ理論に裏付けられた理論基盤を持ち、グラフ分割や、グラフ上のクラスタリング、コミュニティ検出、異常検知、グラフニューラルネットなど、さまざまなグラフ解析タスクに応用されている。グラフ分割タスク等で標準的に使われているマルチレベル型手法のような局所最適化に基づく離散型のヒューリスティックでは、書き込み順序によって解が変わりうる非同期処理を伴わなければ高い並列性能が得られないため、通常、再現可能性を犠牲にする。一方、スペクトラルアルゴリズムは離散型のヒューリスティックと比べ、計算量が大きくなる傾向があるが、同一の計算環境・パラメータ・乱数シード・並列度での実行において同一の近似解を得ることができる並列化の実現が容易である「再現可能な並列性」という好ましい性質がある。本課題では代表者らが新たに開発した測地距離型射影法による高速並列スペクトラルグラフ解析手法をコミュニティ検出等、新たなグラフ解析タスク向けに拡張し、再現性のある高速並列アルゴリズムの開発を進めた。特に、以下の課題:1) 非常に疎なグラフに対する精度劣化、2) 頂点次数分布の偏りが大きいグラフに対する精度劣化、3) 浮動小数点演算の非結合性の考慮による再現可能性の保証、について取り組んだ。幅広い種類グラフに対応した高精度化手法を開発を見据え、また再現可能性の厳密な保証と性能とのトレードオフを明らかにすることを目的に研究を進めた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
これまで測地距離型射影法の計算の主要部の一つである幅優先探索の高性能実装に取り組んできたが、幅優先探索(=最短経路長計算)と半環上の疎行列ベクトル積には密接な関係あり、本手法を半環の行列演算の枠組みを踏まえて拡張することで、各種グラフ解析タスクの高速高並列かつ再現性を保証したアルゴリズムが開発できる可能性がある。半環の行列演算と各種グラフ解析タスクの関連を調査し、測地距離型射影法の拡張アルゴリズムへの応用可能性について検討を進めた。スペクトラルグラフアルゴリズムは幅優先探索と疎行列ベクトル積によるグローバルな情報を更新する反復計算に基づくため、グラフの全体構造が反復計算が進むごとに徐々に明らかになっていくという性質がある。この性質を利用し、要求メモリのオーバーヘッドを許容した上で、反復計算が進むごとに徐々に最適なデータ分散に近づけていくことが可能な適応的なグラフデータ構造の検討も進めた。 また本研究の派生的な成果として、グラフラプラシアンの概念に基づく次元削減技術の高度化とマテリアルインフォマティクス研究への展開も進めた。
|
今後の研究の推進方策 |
これまでの性能評価実験により、測地距離型射影法では平均頂点次数が2程度の非常に疎なグラフに対して性能が悪化する場合があることがわかっている。この原因は測地距離の最大値が大きくなりすぎることによる数値的不安定性にあると考えられる。この問題に対しては、グラフ分割では最大流問題の解を援用した精度改善手法で一定の解決ができたが、最大流問題解法の計算コストが大きいことや並列化が難しいことから、速度の面で実用性が大幅に低下する。本手法では最大流問題を厳密に解く必要はないため、近似手法による性能改善を主眼とし、非常に疎なグラフに対する高精度手法の開発に取り組む。 通常スペクトラルグラフ解析で用いられるグラフラプラシアン行列は、頂点次数分布の偏りの大きいグラフの解析に対しては適切でないという報告がある。これに対し、さまざまな拡張型グラフラプラシアン行列が提案されているが、これらと測地距離型射影法を組み合わせることで、高精度なアルゴリズムの開発を進める。また、本研究でベースとする測地距離型基底は、頂点次数分布の偏りの大きいグラフに対しては部分空間の次元が小さくなるという性質があり、精度劣化発生のおそれがある。このような問題を解決するため基底生成法の拡張も併せて取り組む。
|