| Project/Area Number |
24K20748
|
| Research Category |
Grant-in-Aid for Early-Career Scientists
|
| Allocation Type | Multi-year Fund |
| Review Section |
Basic Section 60030:Statistical science-related
|
| Research Institution | Tokyo University of Science |
Principal Investigator |
江頭 健斗 東京理科大学, 創域理工学部情報計算科学科, 助教 (20979869)
|
| Project Period (FY) |
2024-04-01 – 2027-03-31
|
| Project Status |
Granted (Fiscal Year 2024)
|
| Budget Amount *help |
¥3,510,000 (Direct Cost: ¥2,700,000、Indirect Cost: ¥810,000)
Fiscal Year 2026: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2025: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2024: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
|
| Keywords | k-means / カーネルk-means / 高次元小標本 / カーネル法 / 高次元漸近理論 / 高次元データ / クラスタリング / 非線形 |
| Outline of Research at the Start |
高次元小標本データは複雑な構造を有すことから,理論基盤構築の意味も含め,線形特徴量に基づく方法論が主に発展してきた.一方で,カーネル法は,カーネル関数等の選択上,線形特徴量に基づいた方法論に導入することで,非線形特徴量の活用も可能とする. 本研究では,対象の方法論をクラスタリング手法に絞り,線形特徴量に基づいた方法論の理論的性質とカーネル法導入が有効かの関係性を明示的に表現する.その得た理論に基づき,既存カーネル関数のパラメータ決定法の提案と新しいカーネル関数の開発を行う.これにより多種多様な特徴を持つ高次元データの解析を必要とする諸分野への貢献が期待できる.
|
| Outline of Annual Research Achievements |
令和6年度は,理論的基盤としてk-means法の高次元漸近理論を構築するとともに,研究課題として「カーネル法を導入したk-means法の理論的性質の解明」に着手した.
まず,高次元において既存研究が不十分であったk-means法に着目し,母集団間の平均の差に対する共分散行列の差の比がある値以下であるという条件のもと,誤分類確率に関する一致性が成り立つことを導出した.さらに,この理論をカーネルk-means法へと拡張し,母集団間のどのような非線形特徴量を利用してクラスタリングが行われているのかを明らかにした.とりわけ,ガウシアンカーネル関数を用いたカーネルk-means法においては,ハイパーパラメータが適切に選ばれた場合であっても,従来のk-means法と高次元漸近的に同等の性能しか得られないことを示した.これは,カーネル法の導入が常にクラスタリング精度の向上につながるとは限らないことを意味している.
こうした課題に対し,高次元小標本の枠組みにおいて,新たにバイアス補正k-means法を提案した.本手法は,通常のk-means法に対して簡便な修正を加えるのみで,従来のk-means法において誤分類確率の一致性を保証するために必要とされていた十分条件を要しない点において特徴的である.さらに,本手法はカーネル法の導入による性能向上の可能性を内包しており,高次元データに対する高精度なクラスタリング手法としての発展が期待される.
|
| Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
カーネル法を導入したk-means法の高次元漸近的性質の解明が進んでいることからも,順調に進展している.
|
| Strategy for Future Research Activity |
令和6年度の研究を用いて,多項式カーネル関数を用いたカーネルk-means法の高次元漸近的性質を導出し,従来のk-means法との比較の上,カーネル関数の使い分けに関した考察を与える.加えて,「カーネル法を導入した階層的クラスタリングの理論的性質の解明」に着手する.
|