2020 Fiscal Year Research-status Report
High-dimension, low-sample-size asymptotic theory for nonlinear feature selection
Project/Area Number |
20K22305
|
Research Institution | Kyoto University |
Principal Investigator |
中山 優吾 京都大学, 情報学研究科, 助教 (40884169)
|
Project Period (FY) |
2020-09-11 – 2022-03-31
|
Keywords | 高次元データ / 機械学習 / 非線形 / 高次元小標本 / クラスタリング / 外れ値検出 |
Outline of Annual Research Achievements |
高次元空間の非線形性を解き明かすために、非線形手法としてしばしば使用されるカーネル法の理論解析を進めた。高次元統計解析では、通常のPCAの解析が進められているが、それを含むカーネルPCAで、次の2つを遂行した。 (1) カーネルPCAを用いたクラスタリング (2) カーネルPCAを用いた外れ値検出 カーネル関数のある条件を満たす部分集合上での一般論を展開し、(1)ではカーネルPCAを用いたクラスタリング手法を提案した。外れ値が混入したとき、高次元データで仮定される幾つかの条件は満たされなくなってしまうため、外れ値の除去は高次元統計解析で重要なタスクである。そこで、(1)を応用し、(2)ではクラスタリングに基づく外れ値検出を考案した。外れ値検出では漸近的性質を用いることで、外れ値の判定のための閾値を与えることができた。特に、ガウシアンカーネルでの漸近的性質を詳細に研究し、どのような非線形性によって性能が向上するのかについても理論的に解明した。カーネル関数に含まれるハイパーパラメータの選択も高次元では計算コストが膨大になるため、反復法を必要としないチューニングが求められる。そこで、漸近的結果から高速な選択法を導出した。遺伝子発現データを用いて、その有効性を検証した。これらの結果は国内の研究集会において、報告した。本研究に関連して、カーネル法の一般的枠組みにおけるSVMのバイアス補正とチューニング方法も考え、国際雑誌で採択された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
非線形性を調査するために先駆けとしてカーネルPCAによるクラスタリングや外れ値検出という応用を考えた。この結果はカーネルPCA全体を解明する第一歩となるため、おおむね順調に進展していると評価できる。
|
Strategy for Future Research Activity |
高次元データに対するカーネルPCA一般の固有解析を進め、機械学習方面でも用いられる非線形次元圧縮も理論的に調査していく。
|
Research Products
(6 results)