研究課題/領域番号 |
18K03419
|
研究機関 | 島根大学 |
研究代表者 |
山田 隆行 島根大学, 学術研究院理工学系, 准教授 (60510956)
|
研究期間 (年度) |
2018-04-01 – 2023-03-31
|
キーワード | 高次元データ / 漸近分布 / 統計的仮説検定 / 統計的推論 |
研究実績の概要 |
今年度の研究については以下の2つがある。 まず、正規母集団からえられた高次元データの完全独立性に対する検定について、標本相関係数の2乗の和を検定統計量とするものがある。その後、標本相関係数の2乗と1からそれを引いた差で比の値を取ったものの和を検定統計量とするものが発表された。近年標本相関係数の冪乗和に基づく検定法が発表され、検出力の面でこれまでの研究より優れることが報告されている。そこで、標本相関係数の2乗と1からそれを引いた差で比の値を取ったもののをさらに冪乗して検定統計量と提案し、帰無仮説の下において、標本サイズと次元数をともに大きくする漸近枠組みにおいて極限近似を与えた。この近似分布による検定法の検出力をシミュレーションによって比較し、どの冪の数が2のほうが1のときより標本サイズと次元数が大きくなるにつれ第1種の過誤確率の精度がよくなった。また冪乗和に基づく検定法の先行研究で提案されていたアダプティブ型の検定法についても検討し、数値実験により冪和の検定法より検出力が高くなることを確認した。本研究内容については日本計算機統計学会第35回大会にて発表し、現在論文として投稿準備を進めている。 第2に、高次元データに対する2群の判別問題における変数選択について、成分毎に2標本のT検定統計量を構成し、それが閾値より大きくなる場合に必要な変数とする変数選択法について、標本サイズと次元数を大きくする漸近枠組みにおいて、選択してくる変数が真に平均が異なる変数に一致する確率が1に収束することを示した。この選択法により選択した変数で線形判別法構成し、その誤判別確率の推定をクロスバリデーションによって行なった際に、先行研究での変数選択法と精度は変わらないものが得られたが、選択する変数の数が少なくなる傾向が見られた。以上の結果を2021年度日本分類学会シンポジウムにて発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
コロナ禍で十分に研究の打ち合わせができず研究が遅れている。
|
今後の研究の推進方策 |
引き続き理論研究と数値実験を行う。
|
次年度使用額が生じた理由 |
コロナ禍で海外で開催されている国際学会に現地参加できないため
|