2020 Fiscal Year Research-status Report
Project/Area Number |
18K03409
|
Research Institution | University of Tsukuba |
Principal Investigator |
矢田 和善 筑波大学, 数理物質系, 准教授 (90585803)
|
Co-Investigator(Kenkyū-buntansha) |
青嶋 誠 筑波大学, 数理物質系, 教授 (90246679)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | 高次元PCA / 高次元クラスタリング / 高次元スパース推測 |
Outline of Annual Research Achievements |
令和元年度の研究を踏まえて、研究課題「新たな高次元スパースPCA法の考案」に取り組んだ。 研究代表者はYata and Aoshima (2012, JMVA)でノイズ掃き出し法を開発し、固有ベクトルの一致性を高次元小標本のもとで示した。しかし、そこでは固有ベクトルの内積に関する一致性を示しており、固有ベクトルのすべての成分における一致性という、より高い精度をもつまでには至っていなかった。一方、Shen and Huang (2008, JMVA)は従来型PCAにスパースモデリングを融合し、PCAに簡易な解を与えた。しかし、従来型PCAは高次元小標本の枠組みに一致性をもつ解がないことが、Yata and Aoshima (2009, CSTM)で証明されている。本研究は、令和元年度の研究「高次元統計量における高次漸近論の開拓」を踏まえて、ノイズ掃き出し法をスパースモデリングに融合させることで正則化ノイズ掃き出し法を考案した。具体的には、ノイズ掃き出し法による固有ベクトルについて、その成分の小さいものから順に0とし、適切にスパース化することで、すべての成分の一致性という高い精度をもつまでノイズ掃き出し法を改良した。さらに、この正則化ノイズ掃き出し法をクラスタリングに応用し、300万次元をもつ超高次元な次世代シーケンサーデータにおいても、高速かつ高精度な解析ができることを例示した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の応用面での土台となる研究課題「新たな高次元スパースPCA法の考案」が進んでいることからも、順調に進展している。
|
Strategy for Future Research Activity |
令和2年度の研究を踏まえて、研究課題「高次元データの判別分析の最適性指標の構築と高次元カーネルPCA法の漸近理論の構築」に取り組む。 近年、高次元データにおける判別方式が乱雑に提案されているが、その多くが母集団分布に正規性や共分散行列の等質性を仮定している。こういった仮定は数学的扱いを簡単にするものの、現実的ではなく、高次元データの識別情報を見落とすことにもなる。研究代表者はAoshima and Yata (2014, AISM)において、母集団間の距離を2次モーメントまでの特徴量で捉え、高次元データの幾何学的表現に基づく2群判別を提唱した。本研究は、判別を多群に拡張して、誤判別確率に関して高精度を保証するための判別アルゴリズムを構築する。さらに、既存の判別方式と理論的な比較を行い、それぞれの判別方式の最適性を適用条件として導出し、判別方式を選ぶための指標を与える。また、世界的に見て理論研究が進んでいない高次元カーネルPCAについて、一致性を与える条件と適切なカーネルの選択法を提案する。高次元カーネルPCAにより、母集団間の距離を2次以上のモーメントまでの特徴量で捉え、高精度な高次元クラスタリングを可能にする。さらに、高次元小標本のもと理論展開することで、異常値を1つの母集団(クラス)と考えることにより、高次元カーネルPCAによる異常値検出法を開発する。
|
Research Products
(28 results)