研究課題/領域番号 |
22K12046
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60090:高性能計算関連
|
研究機関 | 筑波大学 |
研究代表者 |
二村 保徳 筑波大学, システム情報系, 准教授 (30736210)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2023年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2022年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | スペクトラルアルゴリズム / ラプラス固有写像 / 部分空間拡張 / 再現可能並列性 / 固有値解析 / グラフ解析 / 固有値計算 / 数値線形代数 / 並列計算 |
研究開始時の研究の概要 |
本研究課題では、並列計算機上で性能を発揮するグラフ(ネットワーク)解析の高速アルゴリズムを開発する。グラフ分割、コミュニティ検出、異常検知等で活用されるスペクトラルグラフアルゴリズムは、スペクトラルグラフ理論に支えられた理論基盤があり、その有効性が知られている。しかしながら、それらのアルゴリズムはマルチレベル法などの離散型ヒューリスティックに対し速度の面で優位となる場面が限定的であった。本課題では、代表者らが新たに開発した高速化手法を拡張・高度化し、近年重要視されつつある、解析結果が再現可能な並列化を指向した高性能アルゴリズムを構築する。
|
研究実績の概要 |
本年度の研究では、主要な次元削減手法であるラプラス固有写像に対し測地距離型射影法を適用し、その効率化および精度向上に取り組んだ。ラプラス固有写像は高次元空間データ同士の類似度から生成されたグラフ(主にk近傍グラフ等)から誘導されるグラフラプラシアン行列の一部の固有ベクトルによって低次元空間上の座標を決定する手法である。この固有ベクトルの計算高速化するために測地距離型射影法が活用できる。ラプラス固有写像は特に生命科学等の分野の高次元データの分析において、UMAPによる可視化におけるグローバルな関係性を保存する初期配置計算に用いられるなど基盤的な役割を果たしており、応用上も重要である。本研究では、ラプラス固有写像において従来の基本的な測地距離型射影法を単純に適用するだけでは、精度が限定的となったため、新たな部分空間拡張手法を提案した。提案手法により、十分に小さい追加コストで、次元削減の精度を向上させることができた。今後は、部分空間拡張手法のさらなる高度化に注力する。手法の背景にある数学的性質を活用し、さらに効率的な実装を検討する。また、ラプラス固有写像の問題設定に適した新たな精度指標を導入することで部分空間のサイズを動的に調整する手法の開発を行う。さらに、提案手法を複雑ネットワークに関係の深いモジュラリティを指標として活用した次元削減に適用を進め、同手法の並列実装と性能評価を行う計画である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度では測地距離型射影法の新たな適用先として、主要な教師無し次元削減手法のひとつであるラプラス固有写像における固有問題の求解をターゲットとして研究を進めた。ラプラス固有写像は近年特に遺伝子発現データといった生命科学分野の高次元データの可視化に広く使われている次元削減手法であるUMAP(Uniform Manifold Approximation and Projection)の初期配置に用いられ、高次元空間上でのサンプル群のグローバルな関係性を保存する効果をもたらすことが知られている。k近傍グラフの生成に効率的なアルゴリズムが使われる場合、ラプラス固有写像はUMAPの計算主要部となり、この高速化によって広く行われているデータ解析のワークプローの効率化に大きく寄与すると言える。このラプラス固有写像においてさまざまな中規模データセットで測地距離型射影法を適用したが、その精度は限定的となっており、精度向上のための新たな手法が必要であるということがわかった。そのため、射影法で利用する部分空間を拡張する手法を新たに検討した。新たな手法によって計算時間の増加を十分に抑えつつ、高い精度を得ることができた。
|
今後の研究の推進方策 |
今後の展開としては上記の部分空間拡張手法の高度化を行う。現在の実装はナイーブなものであり、背景にある数学的な性質を十分活用できていない。この性質を十分に活かした効率的な実装を開発することでさらなる速度性能向上をめざす。また現段階では拡張する部分空間サイズを自動的に決めることができておらず、安定した精度を得るためには、なんらかの精度指標を用いて部分空間サイズを動的に決める必要がある。線形計算で用いられている従来の精度指標では次元削減という問題設定に対して厳しすぎる傾向にあり、直接使うことは現実的でない。このため対象とする問題設定に適合し、かつ十分に少ない計算量で計算できる新たな精度指標の検討を進める。次年度の研究ではさらに提案法を適用する新たな問題設定として複雑ネットワークの関係の深いモジュラリティに関連する次元削減手法への展開と、それまでに開発したアルゴリズム群の並列実装とその性能評価等を予定している。
|