Multicollinearity Analysis and Variable/Model Selection in Regression
Project/Area Number |
21K01431
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 07030:Economic statistics-related
|
Research Institution | Nagoya University of Commerce & Business |
Principal Investigator |
刈屋 武昭 名古屋商科大学, マネジメント研究科, 教授 (70092624)
|
Co-Investigator(Kenkyū-buntansha) |
林 高樹 慶應義塾大学, 経営管理研究科(日吉), 教授 (80420826)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
Fiscal Year 2023: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2022: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2021: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
|
Keywords | 伝統的OLS枠組の問題点 / 重共線性コントロール / 推定非効率性コントロール / 予測変数の標本分散 / 検定方式への重共線性への影響 / Xによる回帰モデル選択 / 実証的に有効なモデル / モデルのICリスク測度 / 伝統的OLS枠組み / 重共線性問題 / 分散拡大ファクタ / 検出力縮小ファクタ / t検定 / 回帰モデル選択 / yアコモデーティングモデルX / 線形回帰モデル / 重共線性 / 変数・モデル選択 / t値の分解 / 分散拡大係数 |
Outline of Research at the Start |
回帰分析は、経済分析に代表されるように、被説明変数の変動を、その変動を引きおこすと考える複数の説明変数の1次式の変動で説明する。しかし、説明変数のデータの間に互いに説明しあう重共線関係があると、モデルは不安定になるだけでなく、間違ったモデルを選択してしまうので、有効な意思決定・政策決定ができなくなる。この周知の問題に対して、それを避ける有効な方法はいまだ確立されていない。本研究は、この問題に対して一つの合理的な解の提案とそのシステムを開発することを狙う。
|
Outline of Annual Research Achievements |
第一の論文では、伝統的な最小2乗法(OLS)に基づく回帰分析でのモデル選択・変数選択法の枠組みを基礎から変革する、実証的に有効なモデル構築法(EEM法)を展開している。伝統的な被説明変数(y)を利用した推定値の事後的診断法を繰り返しても、「個別」推定値の非効率性、安定性を確保できないため、昨年度の研究実績の内容を深化・進化させ、研究の核となる概念としてのEEMを設定して、yを利用しない説明変数(X)だけでの事前的な選択法を構築した。ここでモデルとは、行列Xの列の部分行列をいう。また、この研究では、個別の変数を選択するのではなく、有効なモデルの集合を選択するのが狙いである。そこでは、、 第1に、EEM法の個別推定値の効率性と安定性の概念を予測の分散の分解による、非効率性の測度(I)と重共線性の測度(C)に求め、これらがXのみに依存する事実から、モデルXの選択を(I,C)を制御して、yを利用しないEEM法を構築した。 第2に、IC測度を用いて、個別推定値全体がEEMとなるモデルの必要十分条件を与えた。また伝統的な比較不能な個別推定値の標準誤差から予測の意味での標準誤差を定義し、EEM法は後者の値を直接的に制御する変数評価法としての役割を果たすことを示した。 第三にモデルの(Xの部分行列の)集合全体に(I,C)測度による半順序を利用して、モデルのリスク概念を定義し、モデル比較を行う。そこでは、重共線性に焦点を当て、EEM法での変数選択法とモデルの許容性の概念を展開する。 第4に、IC測度を制御するために、重共線性を制御する2つのアルゴリズムを開発した。変数増加法と主成分分析を用いた変数減少法である。このアルゴリズムのソフト開発は、共著者が展開している。具体的データに基づくEEM法によるモデル集合の選択事例を与えた。仮説検定に関係する重共線性の影響に関する第二論文は、大幅改定中である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
上記の研究論文を投稿した結果、大幅な改訂が求められ、昨年度にはそのために多くの時間を費やし、もう一つのほぼ完成していた論文も改定の必要に迫られていた。これを今年度に持ち越している。また共同分担者(林)による、EEM法による実証的に有効なモデルの集合選択のアルゴリズムの開発も少し遅れ気味である。2022年度, 共同分担者(林)は, 上記研究論文内で提案しているXMSPを行う2つのアルゴリズム, (i) 変数増加法 (Variable-increasing algorithm), (ii) 変数減少法 (Variable-reduction algorithm)に関して, 統計解析用プログラミング言語Rを用いてプロトタイプの開発を行った.今年度はこれを完成させる予定である。
|
Strategy for Future Research Activity |
現在2回目の大改定を求められている論文を国際的にAランクに属するジャーナルから出版させるようにその努力を継続すること。仮説検定に関わる重共線性の影響とその回避に菅家する第2論文んも最終的仕上げて、同様の雑誌から出版すること。そして、共同分担者(林)は昨年度に作成したこれらのアルゴリズムについて必要な改良を加えた後, シミュレーションデータや実際のデータ分析を行うことで, 更にデバッグを行いつつ機能を確認する. さらに, プログラムの練度を高め, 公開に向けて準備を進める.
|
Report
(2 results)
Research Products
(3 results)