2023 Fiscal Year Research-status Report
Model Selection for Ultra-high Dimensional and Non-linear Data
Project/Area Number |
21K17715
|
Research Institution | Nagasaki University |
Principal Investigator |
梅津 佑太 長崎大学, 情報データ科学部, 准教授 (60793049)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Keywords | スクリーニング / 一般化線形モデル / LAD回帰 / 正則化法 / 超高次元データ |
Outline of Annual Research Achievements |
昨年度に引き続き, 変数の数が標本サイズよりも大きな超高次元データ解析に関して, 目的変数と関連のある説明変数を効率的に選択するための変数選択法の開発を行っている. 本研究では特に, 周辺尤度に基づく変数選択手法であるスクリーニングに着目している. スクリーニングでは, 変数ごとに比較的容易に計算できるスコアを利用し, そのスコアの値がしきい値を超えるものを重要な変数として選択する. 今年度は一般化線形モデルにおける交互作用項の選択や, 線形回帰モデルにおいて目的変数の分布の裾が重い, あるいは, 目的変数に外れ値を含む場合についてロバストなスクリーニングについて考察した. 一般化線形モデルにおける交互作用項の選択については, 変数のスクリーニングと同時にモデルを縮小するクリーニングの2段階で行う手法を提案した. また, 線形回帰モデルにおけるロバストなスクリーニングについては, LAD (least absolute deviation)回帰の罰則付き推定値をスコアの基準としてもちいることと, ブートストラップを用いてしきい値を選択することを提案した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
今年度提案した手法は, 前年度までの成果を拡張して得られた結果である. 同様の方針でより複雑なデータに対するスクリーニング手法を開発できると考えており, その意味で概ね順調に進展していると考える.
|
Strategy for Future Research Activity |
今年度の成果を論文としてまとめるとともに, より柔軟なモデルに対するスクリーニング手法の開発を目標とする.
|
Causes of Carryover |
今年度については予定していた出張を控え, 研究室の設備充実のためのPC・物品・書籍を購入したことによる. 次年度は研究集会や研究打ち合わせのための出張を予定している.
|