2021 Fiscal Year Annual Research Report
Construction of convex optimization schemes for large-scale subspace clustering and its theoretical guarantees
Project/Area Number |
19K20336
|
Research Institution | The University of Tokyo |
Principal Investigator |
松島 慎 東京大学, 大学院総合文化研究科, 准教授 (90721837)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 機械学習 / クラスタリング / 部分空間クラスタリング / 凸最適化 |
Outline of Annual Research Achievements |
本研究の目的は大規模部分空間クラスタリングのための汎用計算機に特化された凸最適化スキームの構築とその理論保証である。目的の達成のため、1)大規模部分空間クラスタリングのための汎用計算機に特化された凸最適化スキームの構築、2)部分空間クラスタリングの大規模アルゴリズムの理論保証を行う計画であった。 本研究では大規模部分空間クラスタリングのためのアルゴリズムを開発した。従来データ数の二乗以上の計算量が必要である学習手法に関し、本提案アルゴリズムではデータ数に比例する計算量のアルゴリズムを開発した。具体的にはSSC(Sparse Subspace Clustering, スパース部分空間クラスタリング)の類似度行列に関して、非零の要素の数をデータ数に比例する量で抑えるアルゴリズムを開発し、実際の計算時間も従来手法に比べて短いことを様々なデータセットを用いて示し、理論的にも実験的にも従来手法に比べて効率がよいことを示した。さらに、クラスタリング精度に関しても従来手法に比べて高いことを実験的に示し、提案アルゴリズムの部分空間の推定に関する理論保証も行った。理論保証の内容は計算量の高い従来のアルゴリズムと同様の理論保証が可能であることを示したことである。さらに、列生成法に基づいて提案した最適化アルゴリズムに関して、目的関数の近似解であっても本来のSSCと同様の理論保証ができることを示した。本研究成果は機械学習の最も重要な国際会議の一つであるThirty-Third Conference on Neural Information Processing Systems (NeurIPS 2019)に採択され、バンクーバーにて発表を行った。
|