2018 Fiscal Year Annual Research Report
Project/Area Number |
18J12123
|
Research Institution | Hiroshima University |
Principal Investigator |
小田 凌也 広島大学, 理学研究科, 特別研究員(DC2)
|
Project Period (FY) |
2018-04-25 – 2020-03-31
|
Keywords | 変数選択 / 高次元一致性 / 多変量線形回帰モデル / 正準判別分析モデル / 統計数学 |
Outline of Annual Research Achievements |
複数の目的変数と説明変数の間の関係を記述した多変量線形回帰モデルと正準判別分析モデルにおいて, 有効な説明変数を選ぶ変数選択問題を扱う. そのような変数選択法に用いられる従来の手法として, AICやCp規準などの変数選択規準をすべての説明変数の組に対して計算し変数選択規準が最小となる変数の組み合わせを最適な変数とする変数選択規準総当たり法が挙げられる. しかし, 説明変数ベクトルの次元数が大きい場合, 変数選択規準総当たり法は物理的に実行不可能であり, 適切な漸近理論の下で真の変数の組み合わせが最適な変数として選ばれる確率が漸近的に1となる性質, 即ち, 一致性の議論はされていない. 本研究の目的は標本数だけでなく目的変数の次元数または説明変数の次元数が大きな高次元データに対しても高速で一致性をもつ変数選択法を提案することである. 多変量線形回帰モデルにおいては, 一般化Cp規準を用いた簡便な変数選択法に注目して新たな変数選択法を提案し, 標本数は必ず無限大であるが目的変数の次元数, 説明変数の次元数は無限大でもそうでなくてもよいという漸近理論の下で提案手法が一致性をもつことを示した. さらに, 提案手法を実行するために必要な行列演算を工夫することで計算の高速化も行った. 数値実験により, 提案手法は次元数の大小に依らず標本数が大きければ高い確率で真の変数の組み合わせを選択し, Group Lasso型罰則項を用いた罰則付き推定法よりも計算時間がかなり短いことを確認した. また正準判別分析においても, 一般化情報量規準を用いた簡便な変数選択法に注目し, 標本数は必ず無限大であるが説明変数の次元数は無限大でもそうでなくてもよいという漸近理論の下で一致性をもつ高速な変数選択法を提案した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初計画していたのは多変量線形回帰モデルに対してのみであったが, 正準判別分析モデルにおいても, 次元数の大小に依らず標本数が大きければ高い確率で真の変数の組み合わせを選択する高速な変数選択法を提案することができたから.
|
Strategy for Future Research Activity |
本研究課題の目的は様々な多変量モデルにおいて高次元下でも一致性をもつ変数選択法を提案することにある. 多変量線形回帰モデル, 正準判別分析モデルにおいては高次元下でも一致性をもち高速な変数選択規準を提案することができた. 今後, 他の多変量モデル, 例えば正準相関分析モデルやGMANOVAモデルなどにおいても変数選択法を提案し, その提案手法の高次元下での一致性について取り組むことは重要である. また, 本研究課題によって提案される変数選択法とスパース推定による変数選択法に関する変数選択法の性能を数値的に比較することも重要である.
|