2023 Fiscal Year Annual Research Report
大規模・複雑データに対するクラスタリング法の開発とその理論的性質の解明
Project/Area Number |
20K19756
|
Research Institution | Osaka University |
Principal Investigator |
寺田 吉壱 大阪大学, 大学院基礎工学研究科, 准教授 (10738793)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 教師なし学習 / 高速化 |
Outline of Annual Research Achievements |
本年度も昨年度に引き続き, 大規模クラスタリングの近似法に関する研究 (研究1) と高速なconvex clustering algorithmの開発 (研究2) を行った. (研究1) 研究1では, 効率の良い密度を用いる方法により近い結果を導くため, k-means法を少し変化させたベクトル量子化法に対して, 高速な反復アルゴリズムを提案した. これにより, k-means法を用いて代表点を作成した場合よりも, 効率的に代表点を作成することが可能となった. 一方で, 局所最適解が多くなり, 安定的な推定が課題であることが明らかとなった. しかし, 安定的に機能するパラメータを選択すれば, 昨年度に提案した方法よりも効率の良い高速化が可能となる. 実際に, 高次元かつ大規模データに対して提案手法を適用したところ, k-means法に基づく近似よりも精度が高くなることを確認できた. (研究2) 昨年度提案したMajorization-Minimizationに基づく効率の良いalgorithm (CCMM) に関する論文の修正を行い, 再投稿を行なった. また, L1 convex clusteringに関しては, 変数も同時にクラスタリングするbiclusteringへの拡張と変数選択を同時に実行できるsparse clusteringへの拡張を行なった. これにより, サンプルサイズが大規模なデータだけでなく, 高次元データへの適用も可能となった. 両研究ともに, 成果をまとめた論文を執筆中であり, 投稿予定である. また, これらの研究に加えて実施していた高次元データに対する非線形クラスタリング法に関する研究をまとめた論文がPattern Recognition誌に採択された.
|
Research Products
(7 results)