2023 Fiscal Year Research-status Report
スペクトラルアルゴリズムによる再現性を指向した高性能並列グラフ解析手法の開発
Project/Area Number |
22K12046
|
Research Institution | University of Tsukuba |
Principal Investigator |
二村 保徳 筑波大学, システム情報系, 准教授 (30736210)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | スペクトラルアルゴリズム / ラプラス固有写像 / 部分空間拡張 |
Outline of Annual Research Achievements |
本年度の研究では、主要な次元削減手法であるラプラス固有写像に対し測地距離型射影法を適用し、その効率化および精度向上に取り組んだ。ラプラス固有写像は高次元空間データ同士の類似度から生成されたグラフ(主にk近傍グラフ等)から誘導されるグラフラプラシアン行列の一部の固有ベクトルによって低次元空間上の座標を決定する手法である。この固有ベクトルの計算高速化するために測地距離型射影法が活用できる。ラプラス固有写像は特に生命科学等の分野の高次元データの分析において、UMAPによる可視化におけるグローバルな関係性を保存する初期配置計算に用いられるなど基盤的な役割を果たしており、応用上も重要である。本研究では、ラプラス固有写像において従来の基本的な測地距離型射影法を単純に適用するだけでは、精度が限定的となったため、新たな部分空間拡張手法を提案した。提案手法により、十分に小さい追加コストで、次元削減の精度を向上させることができた。今後は、部分空間拡張手法のさらなる高度化に注力する。手法の背景にある数学的性質を活用し、さらに効率的な実装を検討する。また、ラプラス固有写像の問題設定に適した新たな精度指標を導入することで部分空間のサイズを動的に調整する手法の開発を行う。さらに、提案手法を複雑ネットワークに関係の深いモジュラリティを指標として活用した次元削減に適用を進め、同手法の並列実装と性能評価を行う計画である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度では測地距離型射影法の新たな適用先として、主要な教師無し次元削減手法のひとつであるラプラス固有写像における固有問題の求解をターゲットとして研究を進めた。ラプラス固有写像は近年特に遺伝子発現データといった生命科学分野の高次元データの可視化に広く使われている次元削減手法であるUMAP(Uniform Manifold Approximation and Projection)の初期配置に用いられ、高次元空間上でのサンプル群のグローバルな関係性を保存する効果をもたらすことが知られている。k近傍グラフの生成に効率的なアルゴリズムが使われる場合、ラプラス固有写像はUMAPの計算主要部となり、この高速化によって広く行われているデータ解析のワークプローの効率化に大きく寄与すると言える。このラプラス固有写像においてさまざまな中規模データセットで測地距離型射影法を適用したが、その精度は限定的となっており、精度向上のための新たな手法が必要であるということがわかった。そのため、射影法で利用する部分空間を拡張する手法を新たに検討した。新たな手法によって計算時間の増加を十分に抑えつつ、高い精度を得ることができた。
|
Strategy for Future Research Activity |
今後の展開としては上記の部分空間拡張手法の高度化を行う。現在の実装はナイーブなものであり、背景にある数学的な性質を十分活用できていない。この性質を十分に活かした効率的な実装を開発することでさらなる速度性能向上をめざす。また現段階では拡張する部分空間サイズを自動的に決めることができておらず、安定した精度を得るためには、なんらかの精度指標を用いて部分空間サイズを動的に決める必要がある。線形計算で用いられている従来の精度指標では次元削減という問題設定に対して厳しすぎる傾向にあり、直接使うことは現実的でない。このため対象とする問題設定に適合し、かつ十分に少ない計算量で計算できる新たな精度指標の検討を進める。次年度の研究ではさらに提案法を適用する新たな問題設定として複雑ネットワークの関係の深いモジュラリティに関連する次元削減手法への展開と、それまでに開発したアルゴリズム群の並列実装とその性能評価等を予定している。
|
Causes of Carryover |
性能評価のための計算サーバーを購入する予定であったが、計算サーバーによる大規模性能評価実験を行う前に、新たな問題設定での提案手法の精度向上が必要であることがわかったため、購入を見送った。次年度は提案手法精度向上における予備実験の結果に対応した性能の計算サーバーを調達する予定である。
|
Research Products
(1 results)