• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Model Selection for Ultra-high Dimensional and Non-linear Data

Research Project

Project/Area Number 21K17715
Research Category

Grant-in-Aid for Early-Career Scientists

Allocation TypeMulti-year Fund
Review Section Basic Section 60030:Statistical science-related
Research InstitutionNagasaki University

Principal Investigator

梅津 佑太  長崎大学, 情報データ科学部, 准教授 (60793049)

Project Period (FY) 2021-04-01 – 2025-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2024: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2023: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2022: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2021: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Keywordsスクリーニング / 一般化線形モデル / LAD回帰 / 正則化法 / 超高次元データ / カーネル法 / 加法モデル / 変数選択 / スパース正則化法 / post-selection inference
Outline of Research at the Start

変数の数が標本サイズよりも非常に大きな超高次元データの解析では、古典的な統計解析を行うことが困難である。データの構造に対してある種のスパース性を仮定し、あらかじめ解析に不要と思われる変数を取り除くことで超高次元データ特有の難しさを緩和することが期待できる。このような手法はスクリーニングと呼ばれるモデル選択の問題の一種である。ところが、非線形の依存関係を抽出しようとすると、既存手法では必要以上に多くの変数をスクリーニングしなければならない。本研究では、非線形の依存関係を効率的に抽出するためのスクリーニング手法の開発および、スクリーニングによって選択されたモデルに対する統計的推論手法を開発する。

Outline of Annual Research Achievements

昨年度に引き続き, 変数の数が標本サイズよりも大きな超高次元データ解析に関して, 目的変数と関連のある説明変数を効率的に選択するための変数選択法の開発を行っている. 本研究では特に, 周辺尤度に基づく変数選択手法であるスクリーニングに着目している. スクリーニングでは, 変数ごとに比較的容易に計算できるスコアを利用し, そのスコアの値がしきい値を超えるものを重要な変数として選択する. 今年度は一般化線形モデルにおける交互作用項の選択や, 線形回帰モデルにおいて目的変数の分布の裾が重い, あるいは, 目的変数に外れ値を含む場合についてロバストなスクリーニングについて考察した. 一般化線形モデルにおける交互作用項の選択については, 変数のスクリーニングと同時にモデルを縮小するクリーニングの2段階で行う手法を提案した. また, 線形回帰モデルにおけるロバストなスクリーニングについては, LAD (least absolute deviation)回帰の罰則付き推定値をスコアの基準としてもちいることと, ブートストラップを用いてしきい値を選択することを提案した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

今年度提案した手法は, 前年度までの成果を拡張して得られた結果である. 同様の方針でより複雑なデータに対するスクリーニング手法を開発できると考えており, その意味で概ね順調に進展していると考える.

Strategy for Future Research Activity

今年度の成果を論文としてまとめるとともに, より柔軟なモデルに対するスクリーニング手法の開発を目標とする.

Report

(3 results)
  • 2023 Research-status Report
  • 2022 Research-status Report
  • 2021 Research-status Report
  • Research Products

    (6 results)

All 2024 2023 2022

All Presentation (5 results) (of which Int'l Joint Research: 2 results,  Invited: 4 results) Book (1 results)

  • [Presentation] On the marginal screening under the least absolute deviation regression models2024

    • Author(s)
      Yuta Umezu
    • Organizer
      研究集会「高次元データ解析・スパース推定法・モデル選択手法の開発と融合」
    • Related Report
      2023 Research-status Report
    • Invited
  • [Presentation] Sure screening for interaction effect in generalized linear models2023

    • Author(s)
      Yuta Umezu
    • Organizer
      6th International Conference on Econometrics and Statistics
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research / Invited
  • [Presentation] スパース周辺回帰モデルに基づくスクリーニング法2023

    • Author(s)
      梅津 佑太
    • Organizer
      研究集会「多変量統計学・統計的モデル選択の新展開」
    • Related Report
      2022 Research-status Report
  • [Presentation] カーネル法に基づく超高次元スクリーニング2022

    • Author(s)
      梅津佑太
    • Organizer
      多様な高次元モデルの理論と方法論:最前線の動向
    • Related Report
      2021 Research-status Report
    • Invited
  • [Presentation] Non-linear variable selection with ultra high-dimensionality2022

    • Author(s)
      Yuta Umezu
    • Organizer
      Joint Seminar: IIIT-Delhi and Nagasaki University Cutting-Edge Issues in Spatial Econometrics and Image Processing: Missing Data, Causal Inference and Machine Learning
    • Related Report
      2021 Research-status Report
    • Int'l Joint Research / Invited
  • [Book] データサイエンスの歩き方2022

    • Author(s)
      滋賀大学データサイエンス学部、長崎大学情報データ科学部
    • Total Pages
      256
    • Publisher
      学術図書出版社
    • ISBN
      9784780609363
    • Related Report
      2021 Research-status Report

URL: 

Published: 2021-04-28   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi