研究実績の概要 |
複数の予測対象である変数(目的変数)とそれらに影響を与えると考えられる変数(説明変数)の関係を記述する多変量線形回帰モデルにおいて, 説明変数を選択するための様々な変数選択法が提案されている. 特に, 一致性をもつ変数選択法は有限標本下でも真のモデルを選択する確率が高いことが期待され, これまで標本数のみを無限大とする大標本漸近枠組みの下で様々な変数選択法の一致性が評価されてきた. 近年では, 標本数のみでなく目的変数ベクトルの次元数もしくは説明変数ベクトルの次元数も大きな高次元データを扱う重要性が高まっている. しかし, 大標本漸近枠組みを用いて一致性を評価した変数選択法は, 高次元データに対して真のモデルを選択する確率が低くなる可能性がある. さらに, これまでに提案されている変数選択法の多くは, 目的変数ベクトルの次元数は標本数よりも小さくないと使用することができず, 一致性を評価する際に真のモデルにおける誤差ベクトルに正規性が仮定されている. そこで本研究では, 目的変数ベクトルの次元数は標本数よりも大きくても使用できるようリッジ型変数選択規準を用いた変数選択法に着目した. さらに, 一致性を保証する際, 真のモデルにおける誤差ベクトルに正規性は仮定せず, 標本数は必ず無限大, 目的変数ベクトルの次元数は標本数を超えて無限大でも固定でもよい, 説明変数ベクトルの次元数は標本数未満の下で無限大でも固定でもよいという大標本高次元漸近枠組みを用いた. 非正規性と大標本高次元漸近枠組みの両方の下で一致性をもつ変数選択法はこれまでに存在しなかった. 本提案手法は非正規性の下でも標本数がある程度大きければ次元数の大小に関わらず真のモデルを選択する確率が高いことが期待できる.
|