研究開始時の研究の概要 |
本研究の目的は, 多変量モデルにおいて, 変数の次元数が標本数を超えた場合も含んでいる高次元大標本データに対して良い性質をもつ変数選択規準を構築することである. 特に, 変数の個数が標本数を超えても実行可能な変数増減法の下で, 真の変数を選択する確率が漸近的に1となる性質である一致性をもつ変数選択規準を構築する. 目的を達成するために, まず多変量モデルの1つである多変量線形回帰モデルにおいて, 標本数は無限大だが説明変数だけでなく目的変数も標本数を超えて無限大としてよい漸近理論により一致性を評価する. 次に, 他の多変量モデルにおける変数選択規準も構築していく.
|
研究実績の概要 |
本研究の目的は, 多変量モデルにおいて, 変数の次元数が標本数を超えた場合も含んでいる高次元大標本データに対して良い性質をもつ変数選択規準を構築することである. 特に, 変数の個数が標本数を超えてもよい高次元下で, 真の変数を選択する確率が漸近的に1となる性質である一致性をもつ規準を構築する. 目的を達成するために, 多変量モデルにおいて, 標本数nは無限大だが変数の個数は無限大としてよい漸近理論により一致性を評価する. 本年度の研究内容は以下の通りである. 本年度は多変量モデルの1つである一般化多変量分散分析 (GMANOVA) モデルにおける基底関数の選択問題を扱った. その際, 標本数nは無限大だが目的変数の個数pは標本数を超えて無限大としてよい漸近理論により一致性を評価し, 一致性をもつ変数選択規準が二乗ロス関数を漸近的に最小にするモデルを選択する確率が1に収束することも示した. また, 候補モデルの数も発散する漸近理論を用いたとき一致性をもつための十分条件を導出し, そのような場合でも一致性をもつ変数選択規準を提案することができた. 上記の研究内容は, 国内学会で発表している. 研究期間全体を通じて実施した研究の成果は以下の通りである. 多変量モデルとして主に多変量線形回帰モデルとGMANOVAモデルを扱い, 高次元漸近理論を用いて一致性をもつための条件を導出した. 特に多変量線形回帰モデルでは, Kick-One-Out (KOO) 法による変数選択法に着目することで, 目的変数だけでなく説明変数も無限大の場合でも一致性をもちかつ計算が高速な変数選択法を提案した. この方法に既存のスクリーニング法を組み合わせることで目的変数と説明変数が標本数未満であるという制約に縛られることなく変数選択が可能である.
|