2014 Fiscal Year Annual Research Report
大規模スパース行列の高速特異値分解法の開発とその実装コード公開
Project/Area Number |
24360038
|
Research Institution | Kyoto University |
Principal Investigator |
中村 佳正 京都大学, 情報学研究科, 教授 (50172458)
|
Co-Investigator(Kenkyū-buntansha) |
木村 欣司 京都大学, 情報学研究科, 准教授 (10447899)
|
Project Period (FY) |
2012-04-01 – 2016-03-31
|
Keywords | 応用数学 / アルゴリズム / 特異値分解 / 大規模スパース行列 / 固有対計算 |
Outline of Annual Research Achievements |
大規模スパース行列の特異値分解はビッグデータ解析の基礎となる重要な行列演算であり本科研費研究の主題である.行列のスパース性を活かすには密行列とは異なる前処理が必要となる.平成26年度には,再直交化つきGolub-Kahan-Lanczosアルゴリズムによって,与えられた大規模スパース行列の近似行列を生成する手法を開発している.2分法と逆反復法による近似行列の特異値計算と特異ベクトル計算により,もとの大規模スパース行列の特異値と左右の特異ベクトルが計算される.近似行列の次数は必要な特異値・特異ベクトルの個数に一致する. Golub-Kahan-Lanczosアルゴリズムは高速であるが数値不安定性をもつため再直交化が必須となる.この研究では古典Gram-SchmidtアルゴリズムをopenMP上で並列化するデータ参照性の高い再直交化手法(OMP-CGS2法)を提案し,様々なタイプの長方スパース行列,様々な次数の近似行列について,修正Gram-Schmidt, 古典Gram-Schmidt,コンパクトWYと比べて,OMP-CGS2法によって最も高速に特異値分解が実行されることを数値実験で示している.さらに,数理モデルを構成し,CPUの特性に応じてどの程度の次数のスパース行列までOMP-CGS2法が最も高速となるかを理論的に解析している.なお,OMP-CGS2法は大規模スパース行列の必要な個数の固有対計算の高速化にも有効であることもわかっている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
スパース行列の高速な特異値分解に必要な前処理技法として,前年までのブロックHouseholder変換による高速2重対角化の進展をふまえ,平成26年度は,より大規模な行列を対象とするため,再直交化つきGolub-Kahan-Lanczosアルゴリズムによって与えられた大規模スパース行列の近似行列を生成する手法にテーマを移し,近似行列の精度を高める高速な再直交化手法(OMP-CGS2法)を提案することができたため.
|
Strategy for Future Research Activity |
平成26年度の研究では,CPUの特性に応じてどの程度の次数のスパース行列までOMP-CGS2法が最も高速となるかを数理モデルによって理論的に解析しているが,これはアーキテクチャの進展によりOMP-CGS2法の優位性がより高まることを意味する.平成26年度に使用したCPUとメモリでは理論上は15万次元行列まで優位性をもつが,これは数値実験の結果にも符合する.そこで,平成27年度に発売されるとされるCPUであるXeon E5 v4を購入してOMP-CGS2法と従来法の使い分けのための適切なパラメータの設定について検証する.このため基金分の一部を平成27年度に繰り越すこととした.
|
Causes of Carryover |
大規模スパース行列の部分固有対・特異対を求めるソルバの開発とその並列化実装を行い,15万次元までの優位性を検証した.大容量キャッシュの搭載したCPU上でこのソルバを実行することで,より大次元の行列に対する提案実装の優位性が期待されるが,マルチCPUの構成が可能なアーキテクチャXeon E5-2699 v3には大容量キャッシュが搭載されていないため,米国ARPACKの実装コードとの性能比較評価ができていない.
|
Expenditure Plan for Carryover Budget |
大容量キャッシュが搭載されたアーキテクチャXeon E5 v4が予定より遅れて平成27年度中盤に登場する.詳細スペックや価格は未定であるが,本科研費の繰越によって購入可能であると考えられ,このアーキテクチャの購入を経て,より大次元のスパース行列に対しても提案実装の優位性を検証し,必要なチューニングを経て,実装コードを公開する. また,並列化実装のプログラミング補助等のため謝金や国際・国内会議発表等のための旅費についても計上したい.
|