• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Research-status Report

High-dimension, low-sample-size asymptotic theory for nonlinear feature selection

Research Project

Project/Area Number 20K22305
Research InstitutionKyoto University

Principal Investigator

中山 優吾  京都大学, 情報学研究科, 助教 (40884169)

Project Period (FY) 2020-09-11 – 2022-03-31
Keywords高次元データ / 機械学習 / 非線形 / 高次元小標本 / クラスタリング / 外れ値検出
Outline of Annual Research Achievements

高次元空間の非線形性を解き明かすために、非線形手法としてしばしば使用されるカーネル法の理論解析を進めた。高次元統計解析では、通常のPCAの解析が進められているが、それを含むカーネルPCAで、次の2つを遂行した。
(1) カーネルPCAを用いたクラスタリング
(2) カーネルPCAを用いた外れ値検出
カーネル関数のある条件を満たす部分集合上での一般論を展開し、(1)ではカーネルPCAを用いたクラスタリング手法を提案した。外れ値が混入したとき、高次元データで仮定される幾つかの条件は満たされなくなってしまうため、外れ値の除去は高次元統計解析で重要なタスクである。そこで、(1)を応用し、(2)ではクラスタリングに基づく外れ値検出を考案した。外れ値検出では漸近的性質を用いることで、外れ値の判定のための閾値を与えることができた。特に、ガウシアンカーネルでの漸近的性質を詳細に研究し、どのような非線形性によって性能が向上するのかについても理論的に解明した。カーネル関数に含まれるハイパーパラメータの選択も高次元では計算コストが膨大になるため、反復法を必要としないチューニングが求められる。そこで、漸近的結果から高速な選択法を導出した。遺伝子発現データを用いて、その有効性を検証した。これらの結果は国内の研究集会において、報告した。本研究に関連して、カーネル法の一般的枠組みにおけるSVMのバイアス補正とチューニング方法も考え、国際雑誌で採択された。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

非線形性を調査するために先駆けとしてカーネルPCAによるクラスタリングや外れ値検出という応用を考えた。この結果はカーネルPCA全体を解明する第一歩となるため、おおむね順調に進展していると評価できる。

Strategy for Future Research Activity

高次元データに対するカーネルPCA一般の固有解析を進め、機械学習方面でも用いられる非線形次元圧縮も理論的に調査していく。

  • Research Products

    (6 results)

All 2021 2020

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (5 results)

  • [Journal Article] Support vector machine and optimal parameter selection for high-dimensional imbalanced data2020

    • Author(s)
      Nakayama Yugo
    • Journal Title

      Communications in Statistics - Simulation and Computation

      Volume: 1 Pages: 1~16

    • DOI

      10.1080/03610918.2020.1813300

    • Peer Reviewed
  • [Presentation] 高次元におけるカーネル主成分分析の漸近的性質と異常値の検出への応用2021

    • Author(s)
      中山優吾,矢田和善,青嶋誠
    • Organizer
      日本数学会2021年度年会
  • [Presentation] 高次元データにおける異常値の検出について2020

    • Author(s)
      中山優吾,矢田和善,青嶋誠
    • Organizer
      科研費シンポジウム「機械学習・統計学・最適化の数理とAI技術への展開 」
  • [Presentation] 高次元カーネル主成分分析に基づく異常値の検出2020

    • Author(s)
      中山優吾,矢田和善,青嶋誠
    • Organizer
      科研費シンポジウム「大規模複雑データの理論と方法論:最前線の動向と新たな展開」
  • [Presentation] Clustering by kernel principal component analysis for high-dimensional data2020

    • Author(s)
      中山優吾,矢田和善,青嶋誠
    • Organizer
      日本数学会 2020年度秋季総合分科会
  • [Presentation] 高次元小標本における異常値の検出2020

    • Author(s)
      中山優吾,矢田和善,青嶋誠
    • Organizer
      2020年度統計関連学会連合大会

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi