本研究では,高次元空間の非線形性を解き明かすために,非線形手法としてしばしば使用されるカーネル法の理論解析を進めてきた.前年度の結果である外れ値検出について,引き継ぎ調査を進めた.高次元データに対して,従来の外れ値検出の手法では,次元の呪いにより,有効に機能しない場合がある.本年度は次元の呪いを回避できるような高次元主成分分析を用いることで外れ値検出を調査した.特に,線形カーネルについて考え,前年度の外れ値検出の結果に加え,高次元データの持つ固有構造に着目することで,Sure Screeningできることを理論的に示した.本研究で提案した手法は,高次元小標本の枠組みにおける他の手法に比べ,偽陽性と真陰性を低く抑えながらも外れ値を検出できるという優位性を持つ.偽陽性とは,正常値であるにもかかわらず外れ値と判定されることであり,真陰性とは,外れ値であるにもかかわらず正常値と判定されることである.これらはどちらも,外れ値検出の精度を評価するための重要な指標である.ここまでの線形カーネルの結果は非線形カーネルの場合に拡張する上での基礎となるため,先行研究のカーネル法と組み合わせることで目標とした非線形性の調査の足掛かりとなる.また,外れ値に関連して,高次元において外れ値にロバストな主成分分析を調査するべくSpatial Signに着目した主成分分析についても調査をした.これらの結果について,学会発表を行い ,一部を国際雑誌に投稿した.
|