2020 Fiscal Year Research-status Report
A fast and simple consistent variable selection method for high-dimensional multivariate data
Project/Area Number |
18K03415
|
Research Institution | Hiroshima University |
Principal Investigator |
柳原 宏和 広島大学, 先進理工系科学研究科(理), 教授 (70342615)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | 変数選択 / モデル選択規準 / 一致性 / 多変量線形回帰 / 有効性 |
Outline of Annual Research Achievements |
目的変数ベクトルの次数が大きい場合での多変量回帰モデルにおいて,モデルの複雑さに対する罰則調整項を伴う一般化Cp規準の最小化に基づく変数選択問題を取り扱う.一般化Cp規準は,Mallows (1973) により提案されたCp規準やFujikoshi and Satoh (1997) により提案された Modified Cp 規準など多くの既存のモデル選択規準を特別な場合として含む,一般的なモデル選択規準である.変数選択問題において,真のモデルが最適なモデルとして選ばれる確率が標本数を無限大としたときに1に収束する性質である,一致性と,期待残差平方和に基づくロス関数について,選ばれたモデルでのロス関数とロス関数の最小値の比が1に確率収束する性質である漸近ロス有効性,また,選ばれたモデルでのロス関数の期待値とロス関数の期待値の最小値の比が1に収束する性質である漸近平均有効性が重要なものとなる.特に,有効性を持つモデル選択規準で変数選択を行えば,漸近的に予測の意味で良い変数選択法であるといえる.本研究において,どのような非心パラメータ行列であっても漸近ロス有効性と漸近平均有効性を持つための罰則調整項の条件を,標本数は無限大になるが,目的変数ベクトルの次元は無限大になってもならなくてもよいという漸近理論の下で導出した.この結果を利用して,目的変数ベクトルの次元の大きさによらず予測精度が高いモデルを最適なモデルとして選択できることが期待できる新たなモデル選択規準を提案した.さらに数値実験により,目的変数ベクトルの次元の大小によらず,ある程度大きな標本数の下で,どのような非心パラメータ行列であっても,高い確率で予測精度の高いモデルを最適なモデルとして選択できていること,またその確率が,Lassoなどの従来の変数選択手法よりも高くなることが確かめられた.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
研究課題では,説明変数の個数も無限大とする漸近理論より一致性を保証するモデル選択規準の提案であり,昨年度までにその漸近理論により一致性を評価することで,新たなモデル選択規準を提案できた.ところが,モデル選択規準では一致性だけでなく,漸近ロス有効性や漸近平均有効性も重要な特性である.そこで,一般化Cp規準が標本数は無限大とするが,目的変数の次元数は無限大でもそうでなくてもどちらでもよいという漸近理論により漸近ロス有効性と漸近平均ロス有効性を持つための罰則調整項の条件も導出し,その結果から,どのような非心パラメータ行列であっても漸近ロス有効性と漸近平均有効性を持つ一般化Cp規準を提案した.一致性だけでなく有効性についての結果も得られたことから,当初の予定以上に進展しているとした.
|
Strategy for Future Research Activity |
昨年度では期待残差平方和に基づく漸近ロス有効性と漸近平均有効性を持つ一般化Cp規準を提案した.しかしながら,期待残差平方和ではなく期待カルバック-ライブラーの距離に基づく有効性も重要な特性の一つである.そこで,一般化情報量規準が標本数は無限大とするが,目的変数の次元数は無限大でもそうでなくてもどちらでもよいという漸近理論により漸近ロス有効性を持つための罰則調整項の条件も導出し,その結果から,どのような非心パラメータ行列であっても漸近ロス有効性を持つ一般化情報量規準を提案する.
|
Causes of Carryover |
昨年度は新型コロナウィルス拡大の影響を受け,予定していた研究打ち合わせ,研究成果発表に行くことができず,旅費の予算を使うことができず予算が余ることになった.今年度はそれを踏まえ,今年度が最終年度になることから,この研究課題で得られた結果を周知させるためにも,今年度の旅費の予算の一部と昨年度の余剰分の予算をwebページを充実させることに使用する.
|