Project/Area Number |
20K19756
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 60030:Statistical science-related
|
Research Institution | Osaka University |
Principal Investigator |
Terada Yoshikazu 大阪大学, 大学院基礎工学研究科, 准教授 (10738793)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Project Status |
Completed (Fiscal Year 2023)
|
Budget Amount *help |
¥2,990,000 (Direct Cost: ¥2,300,000、Indirect Cost: ¥690,000)
Fiscal Year 2022: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2021: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2020: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
|
Keywords | クラスタリング / 高速化 / 教師なし学習 / 大規模データ / 計算量削減 / 漸近理論 / 動的計画法 |
Outline of Research at the Start |
近年,データの大規模化・複雑化に伴い,教師なし分類問題の重要性が再認識されている.しかし,大規模なデータに対しては計算コストの低いk-means法のような単純な方法のみが適用されており,データの背後の分類構造を十分に捉えることができていない可能性がある.本研究では,複雑なクラスタ構造を捉えることが可能で,かつ,大規模なデータに対しても高速に実行可能なクラスタリング法を提案し,その理論的保証を与える.
|
Outline of Final Research Achievements |
In this study, we developed a general computational cost reduction method for large-scale clustering and showed its theoretical properties. Additionally, we developed a fast algorithm for convex clustering that can flexibly capture hierarchical group structures. By using the proposed methods, it is possible to perform complex clustering techniques on over a million data points within one minute, even using a laptop. This enables the rapid estimation of underlying cluster structures in large and complex data.
|
Academic Significance and Societal Importance of the Research Achievements |
近年のデータの大規模化・複雑化に伴い, データからグループ構造を発見するためのクラスタリング法の重要性が増している. しかし, これまで大規模データに対しては, 単純なクラスタ構造しか捉えられないクラスタリング法しか適用ができなかった. 本研究成果により, クラスタリング法を必要とする任意の分野において, 短時間かつ容易に, 大規模データから複雑なクラスタ構造を推定することが可能となった. 本研究を応用することで, 様々な応用分野において, 新たな知見の発見などが期待できる.
|