本研究課題では、様々な分野で扱われるようになってきたビッグデータの解析のため、高次元データに対するノンパラメトリックな手法(データの分布を仮定せずに様々な判断を行う手法)の開発を行うことを目的としている。本年度は主に以下の研究を行った。 1. 高次元データに対するノンパラメトリックな検定は多くの研究者によって研究され、様々なケース(平均ベクトルがゼロベクトルか否か、複数の標本の平均ベクトルの比較、複数の標本の平均ベクトルの平行性の検証、分散分析モデル等)において、ケースバイケースで研究が進んでいる。しかし、これら全てのケースを網羅的に扱う研究は十分に行われていない。そこで、これらの内容をすべて包含した一般化多変量分散分析モデル(GMANOVAモデル)に対する線形仮説の検定統計量を提案し、極限帰無分布の導出を行った。提案手法はこれまでの様々なケースで提案された検定統計量を含み、かつ、これまでにない複雑な仮説についても適用できる手法となった。この結果について、実データでの検証も行い、おおむね実用に耐えうる結果が得られた。 2. これまでの研究で、おおむね考えうる線形モデルにおける仮説検定の検定統計量の帰無分布の極限近似を求めることができた。しかし、極限近似ではサンプルサイズや次元数が小さい場合の近似精度に改善の余地がある。そこで、ノンパラメトリックな設定において、漸近展開のアイデアを用いた改良法の検討を進めている。 3. AICやBICなどの情報量規準は高次元データに対してはその近似精度の問題があることが知られており、正規性の下でのバイアス修正などは行われているが、分布を問わない方法論についてはまだ確立されていない。これまでの研究を活用し、新たなモデル選択基準の開発について検討している。 また、2019年度は関連論文1本が出版され、1本の投稿を行った。
|