2017 Fiscal Year Annual Research Report
Asymptotic Studies for High-Dimensional Data
Project/Area Number |
26800078
|
Research Institution | University of Tsukuba |
Principal Investigator |
矢田 和善 筑波大学, 数理物質系, 准教授 (90585803)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | 高次元判別分析 / 高次元PCA / 高次元SVM / SSEモデル |
Outline of Annual Research Achievements |
平成26年度から28年度までの研究を踏まえて,研究課題「高次元PCAを用いた判別分析法の構築」に取り組み,高次元PCAと高次元判別分析法を融合し,頑健かつ高精度な判別方式を提案した.さらに,機械学習の分類手法であるサポートベクターマシン(SVM)に,バイアス補正を与え,バイアス補正SVMも提案した. まず,平成26年度から平成27年度の研究で考案したノイズに対する2つの固有値モデル「Strongly spiked eigenvalue (SSE) モデル」と「Non-strongly spiked eigenvalue (NSSE)モデル」を高次元分類問題に拡張した.NSSEモデルのもとでは高次元判別関数のノイズを抑えることができ,誤判別率に関する一致性が示せる.しかしながら,より巨大なノイズを含むSSEモデルにおいてはその一致性が主張できない.そこで,平成28年度の研究「高次元PCAを用いた統計的推測法」で考案したデータ変換法を判別分析に用いた.まず,Yata and Aoshima (2012, JMVA)で提案した高次元PCA手法であるノイズ掃き出し法を用いて,スパイクノイズを精密に推定する.さらに,そのノイズ空間を避けるようにデータを変換することで,データに内在するノイズ構造をSSEモデルからNSSEモデルに縮小する.このデータ変換法とAoshima and Yata (2014, AISM)で与えたユークリッド距離に基づく判別方式を融合し,SSEモデルのもとでも高精度な高次元判別分析法を構築した.さらに,高次元SVMについても,スパイクノイズの影響を調査し,高次元バイアス項を導出した.そのバイアスを補正することで,緩い仮定のもとでも一致性を与えるバイアス補正SVMを提案した.
|