Model Selection for Ultra-high Dimensional and Non-linear Data
Project/Area Number |
21K17715
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 60030:Statistical science-related
|
Research Institution | Nagasaki University |
Principal Investigator |
梅津 佑太 長崎大学, 情報データ科学部, 准教授 (60793049)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2024: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2023: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2022: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2021: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
|
Keywords | スクリーニング / 一般化線形モデル / 正則化法 / 超高次元データ / カーネル法 / 加法モデル / 変数選択 / スパース正則化法 / post-selection inference |
Outline of Research at the Start |
変数の数が標本サイズよりも非常に大きな超高次元データの解析では、古典的な統計解析を行うことが困難である。データの構造に対してある種のスパース性を仮定し、あらかじめ解析に不要と思われる変数を取り除くことで超高次元データ特有の難しさを緩和することが期待できる。このような手法はスクリーニングと呼ばれるモデル選択の問題の一種である。ところが、非線形の依存関係を抽出しようとすると、既存手法では必要以上に多くの変数をスクリーニングしなければならない。本研究では、非線形の依存関係を効率的に抽出するためのスクリーニング手法の開発および、スクリーニングによって選択されたモデルに対する統計的推論手法を開発する。
|
Outline of Annual Research Achievements |
変数の数が標本サイズよりも非常に大きな超高次元データ解析に関して, 目的変数と関連のある説明変数を効率的に選択するための変数選択について, 一般化線形モデルのもとで考察した. 具体的には, 一般化線形モデルにおける周辺尤度最大化基準にスパース性を誘導する正則化項を付加することで, シンプルながらも理論的に良い性質を持つ変数選択基準を提案した. 本研究で提案した手法はスクリーニングと呼ばれる変数選択の一種である. アルゴリズムそのものは線形回帰モデルで提案されたものとほぼ同じものであるが, 本研究ではその基準を, ロジスティック回帰モデルやポアソン回帰モデルのような, 一般化線形モデルに対しても同じように適用可能であることを示した. また, スクリーニングでは, 適当なしきい値を定め, 変数選択のスコアがそのしきい値よりも大きければ変数間に関連があると判断する. 本研究では, 上記のような手法の提案とともに, スコアの漸近分布に基づくしきい値の選択についても提案した. 一方, 昨年に引き続き, カーネル法に基づくスクリーニング手法についても現在論文化を目指している.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
今年度行った, 一般化線形モデルに対するスクリーニング手法に関する研究については, 学会誌にて受理済みである. この結果を元に, 変数間に非線形な関係があるような, より複雑なデータに対するスクリーニング手法についても同様の手順で新規性のある研究ができると考えている. 一方, 昨年度に引き続き, カーネル法を用いた非線形な関係性の検出に関する研究についても現在論文としてまとめている最中である.
|
Strategy for Future Research Activity |
昨年度の成果がまだ論文として完成していないため, 早急に論文としてまとめたい. また, 今年度の結果を元に, 交互作用のある一般化線形モデルや, 一般化加法モデルのような, より複雑な現象を解析するためのモデルに対するスクリーニング手法の開発を目標とする.
|
Report
(2 results)
Research Products
(4 results)