• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Research-status Report

高次元データにおける高次漸近理論の開拓とその応用

Research Project

Project/Area Number 18K03409
Research InstitutionUniversity of Tsukuba

Principal Investigator

矢田 和善  筑波大学, 数理物質系, 准教授 (90585803)

Co-Investigator(Kenkyū-buntansha) 青嶋 誠  筑波大学, 数理物質系, 教授 (90246679)
Project Period (FY) 2018-04-01 – 2022-03-31
Keywords高次元PCA / 高次元クラスタリング / 高次元スパース推測
Outline of Annual Research Achievements

令和元年度の研究を踏まえて、研究課題「新たな高次元スパースPCA法の考案」に取り組んだ。
研究代表者はYata and Aoshima (2012, JMVA)でノイズ掃き出し法を開発し、固有ベクトルの一致性を高次元小標本のもとで示した。しかし、そこでは固有ベクトルの内積に関する一致性を示しており、固有ベクトルのすべての成分における一致性という、より高い精度をもつまでには至っていなかった。一方、Shen and Huang (2008, JMVA)は従来型PCAにスパースモデリングを融合し、PCAに簡易な解を与えた。しかし、従来型PCAは高次元小標本の枠組みに一致性をもつ解がないことが、Yata and Aoshima (2009, CSTM)で証明されている。本研究は、令和元年度の研究「高次元統計量における高次漸近論の開拓」を踏まえて、ノイズ掃き出し法をスパースモデリングに融合させることで正則化ノイズ掃き出し法を考案した。具体的には、ノイズ掃き出し法による固有ベクトルについて、その成分の小さいものから順に0とし、適切にスパース化することで、すべての成分の一致性という高い精度をもつまでノイズ掃き出し法を改良した。さらに、この正則化ノイズ掃き出し法をクラスタリングに応用し、300万次元をもつ超高次元な次世代シーケンサーデータにおいても、高速かつ高精度な解析ができることを例示した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究の応用面での土台となる研究課題「新たな高次元スパースPCA法の考案」が進んでいることからも、順調に進展している。

Strategy for Future Research Activity

令和2年度の研究を踏まえて、研究課題「高次元データの判別分析の最適性指標の構築と高次元カーネルPCA法の漸近理論の構築」に取り組む。
近年、高次元データにおける判別方式が乱雑に提案されているが、その多くが母集団分布に正規性や共分散行列の等質性を仮定している。こういった仮定は数学的扱いを簡単にするものの、現実的ではなく、高次元データの識別情報を見落とすことにもなる。研究代表者はAoshima and Yata (2014, AISM)において、母集団間の距離を2次モーメントまでの特徴量で捉え、高次元データの幾何学的表現に基づく2群判別を提唱した。本研究は、判別を多群に拡張して、誤判別確率に関して高精度を保証するための判別アルゴリズムを構築する。さらに、既存の判別方式と理論的な比較を行い、それぞれの判別方式の最適性を適用条件として導出し、判別方式を選ぶための指標を与える。また、世界的に見て理論研究が進んでいない高次元カーネルPCAについて、一致性を与える条件と適切なカーネルの選択法を提案する。高次元カーネルPCAにより、母集団間の距離を2次以上のモーメントまでの特徴量で捉え、高精度な高次元クラスタリングを可能にする。さらに、高次元小標本のもと理論展開することで、異常値を1つの母集団(クラス)と考えることにより、高次元カーネルPCAによる異常値検出法を開発する。

  • Research Products

    (28 results)

All 2021 2020 Other

All Int'l Joint Research (2 results) Journal Article (6 results) (of which Peer Reviewed: 3 results,  Open Access: 4 results) Presentation (18 results) (of which Int'l Joint Research: 1 results) Remarks (2 results)

  • [Int'l Joint Research] Seoul National University(韓国)

    • Country Name
      KOREA (REP. OF KOREA)
    • Counterpart Institution
      Seoul National University
  • [Int'l Joint Research] University of Stavanger(ノルウェー)

    • Country Name
      NORWAY
    • Counterpart Institution
      University of Stavanger
  • [Journal Article] Geometric consistency of principal component scores for high-dimensional mixture models and its application2020

    • Author(s)
      Yata Kazuyoshi、Aoshima Makoto
    • Journal Title

      Scandinavian Journal of Statistics

      Volume: 47 Pages: 899~921

    • DOI

      10.1111/sjos.12432

    • Peer Reviewed / Open Access
  • [Journal Article] Bias-corrected support vector machine with Gaussian kernel in high-dimension, low-sample-size settings2020

    • Author(s)
      Nakayama Yugo、Yata Kazuyoshi、Aoshima Makoto
    • Journal Title

      Annals of the Institute of Statistical Mathematics

      Volume: 72 Pages: 1257~1286

    • DOI

      10.1007/s10463-019-00727-1

    • Peer Reviewed
  • [Journal Article] 単一強スパイク固有値モデルにおける高次元平均ベクトルの2標本検定2020

    • Author(s)
      石井 晶、矢田和善、青嶋 誠
    • Journal Title

      応用統計学

      Volume: 49 Pages: 109~125

    • DOI

      10.5023/jappstat.49.109

    • Peer Reviewed
  • [Journal Article] 高次元におけるDistance Weighted Discriminationについて2020

    • Author(s)
      江頭健斗、矢田和善、青嶋 誠
    • Journal Title

      数理解析研究所講究録

      Volume: 2157 Pages: 1-10

    • Open Access
  • [Journal Article] High-dimensional covariance matrix estimation under the SSE model2020

    • Author(s)
      小西啓介、矢田和善、青嶋 誠
    • Journal Title

      数理解析研究所講究録

      Volume: 2157 Pages: 11-20

    • Open Access
  • [Journal Article] Tests for high-dimensional covariance structures under the non-strongly spiked eigenvalue model2020

    • Author(s)
      石井 晶、矢田和善、青嶋 誠
    • Journal Title

      数理解析研究所講究録

      Volume: 2157 Pages: 21-30

    • Open Access
  • [Presentation] 高次元相互共分散行列の特異値分解とその応用2021

    • Author(s)
      佐々木拓真、矢田和善、青嶋 誠
    • Organizer
      科研費シンポジウム「統計科学の革新にむけて」
  • [Presentation] 高次元におけるDWDとWDWDのバイアス補正とその比較2021

    • Author(s)
      江頭健斗、矢田和善、青嶋 誠
    • Organizer
      科研費シンポジウム「統計科学の革新にむけて」
  • [Presentation] 高次元におけるカーネル主成分分析の漸近的性質と異常値の検出への応用2021

    • Author(s)
      中山優吾、矢田和善、青嶋 誠
    • Organizer
      日本数学会2021年度年会
  • [Presentation] 距離加重判別分析の高次元漸近的性質2021

    • Author(s)
      江頭健斗、矢田和善、青嶋 誠
    • Organizer
      日本数学会2021年度年会
  • [Presentation] High-dimensional statistical analysis of the ALMA spectroscopic map of a nearby galaxy NGC 2532021

    • Author(s)
      Takeuchi Tsutomu、Kono Kai、Yata Kazuyoshi、Aoshima Makoto、Ishii Aki、Nakanishi Koichiro、Egashira Kento、Cooray Suchetha、Kohono Kotatro
    • Organizer
      Galaxy Evolution Workshop 2020
    • Int'l Joint Research
  • [Presentation] Analysis of integral field spectroscopic data as a high-dimensional low-sample size data problem2021

    • Author(s)
      竹内 努、河野 海、中西康一郎、矢田 和善、青嶋 誠、石井 晶、江頭健斗
    • Organizer
      日本天文学会2021年春季年会
  • [Presentation] 高次元スパースPCAの一致性とその応用2020

    • Author(s)
      矢田和善、青嶋 誠
    • Organizer
      2020年度統計関連学会連合大会
  • [Presentation] 高次元小標本における異常値の検出2020

    • Author(s)
      中山優吾、矢田和善、青嶋 誠
    • Organizer
      2020年度統計関連学会連合大会
  • [Presentation] Tests of high-dimensional correlation matrices under the strongly spiked eigenvalue model2020

    • Author(s)
      石井 晶、矢田和善、青嶋 誠
    • Organizer
      2020年度統計関連学会連合大会
  • [Presentation] 高次元データにおける距離加重判別分析の漸近的性質とバイアス補正2020

    • Author(s)
      江頭健斗、矢田和善、青嶋 誠
    • Organizer
      2020年度統計関連学会連合大会
  • [Presentation] 客観的総合指数とその高次元漸近理論による一致性について2020

    • Author(s)
      坂東拓馬、清 智也、矢田和善
    • Organizer
      2020年度統計関連学会連合大会
  • [Presentation] 高次元固有ベクトルの検定について2020

    • Author(s)
      石井 晶、矢田和善、青嶋 誠
    • Organizer
      日本数学会2020年度秋季総合分科会
  • [Presentation] Clustering by kernel principal component analysis for high-dimensional data2020

    • Author(s)
      中山優吾、矢田和善、青嶋 誠
    • Organizer
      日本数学会2020年度秋季総合分科会
  • [Presentation] High-dimensional statistics for integral field spectroscopic data2020

    • Author(s)
      竹内 努、河野 海、中西康一郎、矢田和善、青嶋 誠、石井 晶、江頭健斗
    • Organizer
      初代星初代銀河研究会2020
  • [Presentation] 高次元カーネル主成分分析に基づく異常値の検出2020

    • Author(s)
      中山優吾、矢田和善、青嶋 誠
    • Organizer
      科研費シンポジウム「大規模複雑データの理論と方法論:最前線の動向と新たな展開」
  • [Presentation] Sparse PCA by the noise-reduction methodology2020

    • Author(s)
      矢田和善、青嶋 誠
    • Organizer
      科研費シンポジウム「大規模複雑データの理論と方法論:最前線の動向と新たな展開」
  • [Presentation] Analysis of spatially resolved galaxy spectra as a high-dimensional low-sample size data problem2020

    • Author(s)
      竹内 努、河野 海、中西康一郎、矢田和善、青嶋 誠、石井 晶、江頭健斗
    • Organizer
      科研費シンポジウム「大規模複雑データの理論と方法論:最前線の動向と新たな展開」
  • [Presentation] 高次元データにおける異常値の検出について2020

    • Author(s)
      中山優吾、矢田和善、青嶋 誠
    • Organizer
      科研費シンポジウム「機械学習・統計学・最適化の数理とAI技術への展開」
  • [Remarks] trios

    • URL

      https://trios.tsukuba.ac.jp/researcher/0000000526

  • [Remarks] 青嶋研究室ホームページ

    • URL

      http://www.math.tsukuba.ac.jp/~aoshima-lab/jp/

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi