研究実績の概要 |
令和2年度の研究を踏まえて、研究課題「高次元データの判別分析の最適性指標の構築と高次元カーネルPCA法の漸近理論の構築」に取り組んだ。 近年、高次元データにおける判別方式が乱雑に提案されているが、その多くが母集団分布に正規性や共分散行列の等質性を仮定している。こういった仮定は数学的扱いを簡単にするものの、現実的ではなく、高次元データの識別情報を見落とすことにもなる。研究代表者はAoshima and Yata (2014, AISM)において、母集団間の距離を2次モーメントまでの特徴量で捉え、高次元データの幾何学的表現に基づく2次判別法を提唱した。一方で、Aoshima and Yata (2019, MCAP)において、高次元判別分析における精度は共分散行列の固有値のサイズに大きく依存することを証明している。 本研究は、幾何学的表現に基づく2次判別法にAoshima and Yata (2018, Sinica)で提案したデータ変換法を適用し、固有値の影響を受けない新たな2次判別法を提案した。さらに、既存の判別方式と理論的な比較を行い、それぞれの判別方式の最適性を適用条件として導出し、判別方式を選ぶための指標を与えた。また、世界的に見て理論研究が進んでいない高次元カーネルPCAについて、一致性を与える条件と適切なカーネルの選択法を提案した。高次元カーネルPCAにより、母集団間の距離を2次以上のモーメントまでの特徴量で捉え、高精度な高次元クラスタリングを可能にした。さらに、高次元小標本のもと理論展開することで、異常値を1つの母集団と考えることにより、高次元カーネルPCAによる異常値検出法を開発した。
|