• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

非線形特徴量選択に関する高次元小標本漸近論

研究課題

研究課題/領域番号 20K22305
研究種目

研究活動スタート支援

配分区分基金
審査区分 0201:代数学、幾何学、解析学、応用数学およびその関連分野
研究機関京都大学

研究代表者

中山 優吾  京都大学, 情報学研究科, 助教 (40884169)

研究期間 (年度) 2020-09-11 – 2023-03-31
研究課題ステータス 完了 (2022年度)
配分額 *注記
2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
2021年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
キーワード高次元データ / 機械学習 / 非線形 / 高次元小標本 / 外れ値検出 / クラスタリング / 特徴量選択
研究開始時の研究の概要

近年観測されるデータの規模は非常に膨大であり,遺伝子発現データであれば数万にも及ぶ遺伝子を観測できる一方で,解析に十分な標本数を実験にかかるコストの問題等から担保できない状況が起きている.このような高次元小標本データは高次元故の潜在空間とノイズ空間が混合し,解析が困難となる.この複雑系を解くために,高次元小標本空間における非線形な特徴量に注目する.数理統計学と機械学習の側面それぞれからカーネル主成分分析を用いた高次元空間の非線形性と高次元小標本における機械学習を用いた非線形性の解析を推進する.

研究成果の概要

高次元データの非線形性を調査するために,カーネル関数を用いた主成分分析を高次元漸近理論の枠組みで調査した.主成分分析を用いたクラスタリングと外れ値検出の手法を提案し,特に,経験的に度々使用されるガウシアンカーネルのチューニングパラメータに関する理論評価を与えることで,その最適性を議論した.外れ値の有無に関して,主成分分析を用いた検定方式を提案し,複数の外れ値を特定できるような手法も考案した.また,外れ値に関連し,高次元データのロバスト性についてもSpatial Signに着目し,研究を進めた.

研究成果の学術的意義や社会的意義

近年観測されるデータの次元数は非常に多くなっており,例えば,遺伝子発現データでは数万の遺伝子を観測することができる.しかし,実験にかかるコストなどの問題から,解析に十分なサンプル数を確保することができない.このようなデータは解析が難しいため,本研究では非線形な特徴量に注目し,カーネル関数を用いた主成分分析を用いた解析手法を提案した.これにより,高次元データのクラスタリングや外れ値検出が可能となった.提案手法は標本数が少ない高次元データでも機能し,計算コストが問題となる高次元データ解析において効果的である.

報告書

(4件)
  • 2022 実績報告書   研究成果報告書 ( PDF )
  • 2021 実施状況報告書
  • 2020 実施状況報告書
  • 研究成果

    (14件)

すべて 2022 2021 2020

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 1件) 学会発表 (12件) (うち国際学会 2件、 招待講演 2件)

  • [雑誌論文] Clustering by principal component analysis with Gaussian kernel in high-dimension, low-sample-size settings2021

    • 著者名/発表者名
      Nakayama Yugo、Yata Kazuyoshi、Aoshima Makoto
    • 雑誌名

      Journal of Multivariate Analysis

      巻: 185 ページ: 104779-104779

    • DOI

      10.1016/j.jmva.2021.104779

    • 関連する報告書
      2021 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Support vector machine and optimal parameter selection for high-dimensional imbalanced data2020

    • 著者名/発表者名
      Nakayama Yugo
    • 雑誌名

      Communications in Statistics - Simulation and Computation

      巻: 1 号: 11 ページ: 1-16

    • DOI

      10.1080/03610918.2020.1813300

    • 関連する報告書
      2020 実施状況報告書
    • 査読あり
  • [学会発表] Multiple outlier detection test with PCA in high-dimension, low-sample-size settings2022

    • 著者名/発表者名
      中山優吾, 矢田和善, 青嶋誠
    • 学会等名
      2022年度統計関連学会連合大会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 高次元主成分スコアに基づく異常値の検出法2022

    • 著者名/発表者名
      中山優吾,矢田和善,青嶋誠
    • 学会等名
      日本数学会2022年度年会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 高次元におけるカーネル主成分分析の漸近的性質とその応用2022

    • 著者名/発表者名
      中山優吾,矢田和善,青嶋誠
    • 学会等名
      多様な高次元モデルの理論と方法論:最前線の動向
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] Asymptotic properties of high-dimensional kernel PCA and its applications2021

    • 著者名/発表者名
      中山優吾,矢田和善,青嶋誠
    • 学会等名
      International Symposium on New Developments of Theories and Methodologies for Large Complex Data
    • 関連する報告書
      2021 実施状況報告書
    • 国際学会 / 招待講演
  • [学会発表] ガウシアンカーネルに基づく高次元データの分類問題2021

    • 著者名/発表者名
      中山優吾
    • 学会等名
      2021年度秋季総合分科会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 高次元における重み付き判別分析とデータ変換法について2021

    • 著者名/発表者名
      中山優吾,矢田和善,青嶋誠
    • 学会等名
      2021年度統計関連学会連合大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] Clustering by kernel PCA with Gaussian kernel and tuning for high-dimensional data2021

    • 著者名/発表者名
      Yugo Nakayama, Kazuyoshi Yata, Makoto Aoshima
    • 学会等名
      The 4th International Conference on Econometrics and Statistics
    • 関連する報告書
      2021 実施状況報告書
    • 国際学会 / 招待講演
  • [学会発表] 高次元におけるカーネル主成分分析の漸近的性質と異常値の検出への応用2021

    • 著者名/発表者名
      中山優吾,矢田和善,青嶋誠
    • 学会等名
      日本数学会2021年度年会
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] 高次元データにおける異常値の検出について2020

    • 著者名/発表者名
      中山優吾,矢田和善,青嶋誠
    • 学会等名
      科研費シンポジウム「機械学習・統計学・最適化の数理とAI技術への展開 」
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] 高次元カーネル主成分分析に基づく異常値の検出2020

    • 著者名/発表者名
      中山優吾,矢田和善,青嶋誠
    • 学会等名
      科研費シンポジウム「大規模複雑データの理論と方法論:最前線の動向と新たな展開」
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] Clustering by kernel principal component analysis for high-dimensional data2020

    • 著者名/発表者名
      中山優吾,矢田和善,青嶋誠
    • 学会等名
      日本数学会 2020年度秋季総合分科会
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] 高次元小標本における異常値の検出2020

    • 著者名/発表者名
      中山優吾,矢田和善,青嶋誠
    • 学会等名
      2020年度統計関連学会連合大会
    • 関連する報告書
      2020 実施状況報告書

URL: 

公開日: 2020-09-29   更新日: 2024-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi