• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

高次元小標本におけるクラスタリング手法とカーネル法の有効性に関する理論と応用

Research Project

Project/Area Number 24K20748
Research Category

Grant-in-Aid for Early-Career Scientists

Allocation TypeMulti-year Fund
Review Section Basic Section 60030:Statistical science-related
Research InstitutionTokyo University of Science

Principal Investigator

江頭 健斗  東京理科大学, 創域理工学部情報計算科学科, 助教 (20979869)

Project Period (FY) 2024-04-01 – 2027-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥3,510,000 (Direct Cost: ¥2,700,000、Indirect Cost: ¥810,000)
Fiscal Year 2026: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2025: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2024: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Keywordsk-means / カーネルk-means / 高次元小標本 / カーネル法 / 高次元漸近理論 / 高次元データ / クラスタリング / 非線形
Outline of Research at the Start

高次元小標本データは複雑な構造を有すことから,理論基盤構築の意味も含め,線形特徴量に基づく方法論が主に発展してきた.一方で,カーネル法は,カーネル関数等の選択上,線形特徴量に基づいた方法論に導入することで,非線形特徴量の活用も可能とする.
本研究では,対象の方法論をクラスタリング手法に絞り,線形特徴量に基づいた方法論の理論的性質とカーネル法導入が有効かの関係性を明示的に表現する.その得た理論に基づき,既存カーネル関数のパラメータ決定法の提案と新しいカーネル関数の開発を行う.これにより多種多様な特徴を持つ高次元データの解析を必要とする諸分野への貢献が期待できる.

Outline of Annual Research Achievements

令和6年度は,理論的基盤としてk-means法の高次元漸近理論を構築するとともに,研究課題として「カーネル法を導入したk-means法の理論的性質の解明」に着手した.

まず,高次元において既存研究が不十分であったk-means法に着目し,母集団間の平均の差に対する共分散行列の差の比がある値以下であるという条件のもと,誤分類確率に関する一致性が成り立つことを導出した.さらに,この理論をカーネルk-means法へと拡張し,母集団間のどのような非線形特徴量を利用してクラスタリングが行われているのかを明らかにした.とりわけ,ガウシアンカーネル関数を用いたカーネルk-means法においては,ハイパーパラメータが適切に選ばれた場合であっても,従来のk-means法と高次元漸近的に同等の性能しか得られないことを示した.これは,カーネル法の導入が常にクラスタリング精度の向上につながるとは限らないことを意味している.

こうした課題に対し,高次元小標本の枠組みにおいて,新たにバイアス補正k-means法を提案した.本手法は,通常のk-means法に対して簡便な修正を加えるのみで,従来のk-means法において誤分類確率の一致性を保証するために必要とされていた十分条件を要しない点において特徴的である.さらに,本手法はカーネル法の導入による性能向上の可能性を内包しており,高次元データに対する高精度なクラスタリング手法としての発展が期待される.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

カーネル法を導入したk-means法の高次元漸近的性質の解明が進んでいることからも,順調に進展している.

Strategy for Future Research Activity

令和6年度の研究を用いて,多項式カーネル関数を用いたカーネルk-means法の高次元漸近的性質を導出し,従来のk-means法との比較の上,カーネル関数の使い分けに関した考察を与える.加えて,「カーネル法を導入した階層的クラスタリングの理論的性質の解明」に着手する.

Report

(1 results)
  • 2024 Research-status Report
  • Research Products

    (8 results)

All 2025 2024

All Journal Article (1 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (7 results) (of which Int'l Joint Research: 3 results,  Invited: 3 results)

  • [Journal Article] 高次元統計解析で探る銀河の分子ガスの物理状態と天文学への展望2024

    • Author(s)
      竹内 努, 矢田和善, 江頭健斗, 青嶋 誠, 吉川耕司, 石井 晶, 加納龍生, 施 文, 曹 愛奈, 馬 海霞, 松井瀬奈, 中西康一郎, クレ スチェータ, 河野 孝太郎
    • Journal Title

      統計数理

      Volume: 72 Pages: 273-303

    • Related Report
      2024 Research-status Report
    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Presentation] 高次元データにおけるユークリッド距離を用いた変化点検知について2025

    • Author(s)
      江頭健斗, 矢田和善, 青嶋 誠
    • Organizer
      日本数学会2025年度年会
    • Related Report
      2024 Research-status Report
  • [Presentation] 高次元小標本における k-means 法のバイアス補正2025

    • Author(s)
      江頭健斗, 矢田和善, 青嶋 誠
    • Organizer
      京都大学数理解析研究所研究集会「統計モデルとその有効性」
    • Related Report
      2024 Research-status Report
  • [Presentation] Asymptotic properties of k-means and its bias correction under high dimensional settings2024

    • Author(s)
      Kento Egashira, Kazuyoshi Yata, Makoto Aoshima
    • Organizer
      18th International Joint Conference on Computational and Financial Econometrics and Computational and Methodological Statistics
    • Related Report
      2024 Research-status Report
    • Int'l Joint Research / Invited
  • [Presentation] Asymptotic properties of k-means and its modification under high dimensional settings2024

    • Author(s)
      Kento Egashira, Kazuyoshi Yata, Makoto Aoshima
    • Organizer
      The 2nd Joint Conference on Statistics and Data Science in China
    • Related Report
      2024 Research-status Report
    • Int'l Joint Research / Invited
  • [Presentation] Asymptotic properties of hierarchical clustering for high-dimensional data2024

    • Author(s)
      Kento Egashira, Kazuyoshi Yata, Makoto Aoshima
    • Organizer
      The 8th International Workshop in Sequential Methodologies
    • Related Report
      2024 Research-status Report
    • Int'l Joint Research / Invited
  • [Presentation] Bias-corrected k-means method for high-dimensional low sample size data2024

    • Author(s)
      江頭健斗, 矢田和善, 青嶋 誠
    • Organizer
      科研費シンポジウム「統構造化されたデータ解析とその統計・機械学習モデルの新展開」
    • Related Report
      2024 Research-status Report
  • [Presentation] 高次元データにおけるk-means法の補正について2024

    • Author(s)
      江頭健斗, 矢田和善, 青嶋 誠
    • Organizer
      日本数学会2024年度秋季総合分科会
    • Related Report
      2024 Research-status Report

URL: 

Published: 2024-04-05   Modified: 2025-12-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi