• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2019 Fiscal Year Research-status Report

Statistical inference in exploratory data analysis and its application

Research Project

Project/Area Number 18K18010
Research InstitutionNagoya Institute of Technology

Principal Investigator

梅津 佑太  名古屋工業大学, 工学(系)研究科(研究院), 助教 (60793049)

Project Period (FY) 2018-04-01 – 2021-03-31
Keywordsモデル選択 / selective inference / 仮説検定 / スパース正則化法 / 高次元漸近理論
Outline of Annual Research Achievements

変化点検出やモデル選択など, データから探索的に選択された仮説を統計的に検証するということが本研究の目的である. データが正規分布に従うという仮定の下, 選択されたモデルや変化点を条件づけることで, 選択的なp値を用いて妥当な仮説検定を定式化できる, ということが昨年度の結果である. 本年度は, 高次元分類問題でも同様の解析が可能となったことである. 高次元分類問題では, そもそも高次元データに解析が難しいこと, および, データが離散的であるため正規性の仮定が不自然であるという難しさが生じる. 前者に対しては, sure independence screeningによるシンプルな方法で, 変数の次元を削減することとした. また, 後者に対しては, サンプルサイズとともにsure independenceで選択されたモデルの大きさが増大しても良いという, 高次元大標本理論を用いてスコア統計量の漸近正規性を導出した. 結果として, 昨年度と同様の枠組みでselective inferenceを行うことが可能となった. 数値実験とベンチマークデータによる実験を通して, データ分割を用いたナイーブな方法と比較して有用な手法であることを確認した. また, 超高次元非線型回帰モデルのモデル選択についても着手し, 良いモデル選択手法であることを理論的に示した. この方法は, sure independence screeningを自然に非線型回帰モデルへ拡張したものであり, 実装も比較的容易に行うことができる. さらに, ノンパラメトリックな変数選択基準として提案された多くの既存手法と比較して数値的にも有用な手法であることを確認した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

データが正規分布に従うという仮定の下では, 非常にシンプルな理論を展開してselective inferenceのフレムワークを定式化することができた. ところが, 応答変数が離散的な場合や, 分布の裾が重い場合など, 正規性を緩和することは重要な課題の一つである. 本年度は, 分類問題に対して正規性を緩和することができたため, おおむね順調に進展していると考える. 一方で, 一般化線形回帰モデルなど, より広いクラスのもでるに対して同様の主張を行うことができなかった. 一般化線形回帰モデルや, 他のモデル選択手法に対してselective inferenceを定式化できたならば, 区分を「当初の計画以上に進展している」として良かったと思っている.

Strategy for Future Research Activity

高次元分類問題で得られた知見をもとに, より広いクラスのモデルに対してselective inferenceのフレームワークを拡張する. 一般化線形回帰モデルはデータ解析において標準的なモデルであり, このようなモデルへselective inferenceを拡張することは重要だと考えている.一方, 超高次元非線型回帰モデルのモデル選択についても, モデル選択後の関数の統計的有意性を検証するために, selective inferenceのアイデアを適用できるような理論の構築を目指す.

Causes of Carryover

昨年度に引き続き, 手法の完成を優先させたため高性能な計算機器の購入と海外での国際会議への参加を控えたことによる. 手法の開発はひとまず落ち着いたため, 大規模な計算が可能な最新のパーソナルコンピュータを購入予定である(1400千円). また,手法のさらなる拡張, 改良を目的とした研究者との交流を予定している(国外旅費: 300千円, 国内旅費: 100千円).

  • Research Products

    (4 results)

All 2020 2019

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (2 results) Book (1 results)

  • [Journal Article] Selective inference via marginal screening for high dimensional classification2019

    • Author(s)
      Yuta Umezu, Ichiro Takeuchi
    • Journal Title

      Japanese Journal of Statistics and Data Science

      Volume: 2 Pages: 559, 589

    • DOI

      10.1007/s42081-019-00058-8

    • Peer Reviewed
  • [Presentation] 超高次元スパース加法モデルにおける変数選択2019

    • Author(s)
      梅津佑太
    • Organizer
      科研費シンポジウム「統計学と機械学習の数理と展開」
  • [Presentation] 超高次元加法モデルにおける変数選択2019

    • Author(s)
      梅津佑太
    • Organizer
      第22回情報論的学習理論ワークショップ(IBIS2019)
  • [Book] スパース回帰分析とパターン認識2020

    • Author(s)
      梅津 佑太, 西井 龍映, 上田 勇祐
    • Total Pages
      208
    • Publisher
      講談社サイエンティフィク
    • ISBN
      978-4-06-518620-6

URL: 

Published: 2021-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi