• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

探索的データ解析における統計的推論とその応用

研究課題

研究課題/領域番号 18K18010
研究種目

若手研究

配分区分基金
審査区分 小区分60030:統計科学関連
研究機関長崎大学 (2020)
名古屋工業大学 (2018-2019)

研究代表者

梅津 佑太  長崎大学, 情報データ科学部, 准教授 (60793049)

研究期間 (年度) 2018-04-01 – 2021-03-31
研究課題ステータス 完了 (2020年度)
配分額 *注記
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2020年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2019年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2018年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
キーワードモデル選択 / selective inference / 高次元漸近理論 / 教師なし学習 / 教師あり学習 / 仮説検定 / スパース正則化法 / 逆強化学習 / パターンマイニング / 統計数学 / 多変量解析 / 探索的データ解析
研究成果の概要

近年のデータ科学では,検証すべき仮説が定まらないままデータが取得されることが多い.その際,検証すべき仮説の生成と,その仮説の検証を同じデータを用いて行う場合,選択バイアスの問題が生じてしまう.本研究では,選択バイアスを解消するために,selective inferenceと呼ばれるフレームワークに着目し,既存手法の課題の解決を試みた.主要な成果は,selective inferenceのアイデアを教師なし学習へ応用したことと,データの正規性を緩和することでより広いクラスのモデルに対してselective inferenceが適用可能であることを示したことである.

研究成果の学術的意義や社会的意義

近年のデータ科学では,検証すべき仮説が定まらないままデータが取得されることが多い.その際,検証すべき仮説の生成と,その仮説の検証を同じデータを用いて行う場合,選択バイアスの問題が生じてしまう.とはいうものの,データの分割や同じ環境での再実験が困難な場合に統計的なエビデンスを提供するためには,同じデータを用いて仮説の生成と検証を行うことが求められる.本研究では,selective inferenceのアイデアに基づき,いろいろな問題に対してこのような統計解析が可能であることを示した.

報告書

(4件)
  • 2020 実績報告書   研究成果報告書 ( PDF )
  • 2019 実施状況報告書
  • 2018 実施状況報告書
  • 研究成果

    (20件)

すべて 2021 2020 2019 2018

すべて 雑誌論文 (8件) (うち査読あり 8件、 オープンアクセス 5件) 学会発表 (10件) (うち国際学会 1件、 招待講演 4件) 図書 (2件)

  • [雑誌論文] Selective inference for high-order interaction features selected in a stepwise manner2021

    • 著者名/発表者名
      Shinya Suzumura, Kazuya Nakagawa, Yuta Umezu, Koji Tsuda, Ichiro Takeuchi
    • 雑誌名

      IPSJ Transactions on Bioinformatics

      巻: 14 号: 0 ページ: 1-11

    • DOI

      10.2197/ipsjtbio.14.1

    • NAID

      130007985966

    • 関連する報告書
      2020 実績報告書
    • 査読あり
  • [雑誌論文] Variable selection in multivariate linear models for functional data via sparse regularization2020

    • 著者名/発表者名
      Hidetoshi Matsui, Yuta Umezu
    • 雑誌名

      Japanese Journal of Statistics and Data Science

      巻: - 号: 2 ページ: 453-467

    • DOI

      10.1007/s42081-019-00055-x

    • NAID

      210000179793

    • 関連する報告書
      2020 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] A novel sensitive detection method for DNA methylation in circulating free DNA of pancreatic cancer2020

    • 著者名/発表者名
      Shinjo K, Hara K, Nagae G, Umeda T, Katsushima K, Suzuki M, Murofushi Y, Umezu Y, Takeuchi I, Takahashi S, Okuno Y, Matsuo K, Ito H, Tajima S, Aburatani H, Yamao K, Kondo Y.
    • 雑誌名

      PLoS One

      巻: 15 号: 6 ページ: 0233782-0233782

    • DOI

      10.1371/journal.pone.0233782

    • 関連する報告書
      2020 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Selective inference via marginal screening for high dimensional classification2019

    • 著者名/発表者名
      Yuta Umezu, Ichiro Takeuchi
    • 雑誌名

      Japanese Journal of Statistics and Data Science

      巻: 2 号: 2 ページ: 559-589

    • DOI

      10.1007/s42081-019-00058-8

    • NAID

      210000171950

    • 関連する報告書
      2019 実施状況報告書
    • 査読あり
  • [雑誌論文] Efficient Learning Algorithm for Sparse SubSequence Pattern-based Classication and Applications to Comparative Animal Trajectory Data Analysis2019

    • 著者名/発表者名
      Takuto Sakuma, Kazuya Nishi, Kaoru Kishimoto, Kazuya Nakagawa, Masayuki Karasuyama, Yuta Umezu, Shinsuke Kajioka, Shuhei J. Yamazaki, Koutarou D. Kimura, Sakiko Matsumoto, Ken Yoda, Matasaburo Fukutomi, Hisashi Shidara, Hiroto Ogawa, Ichiro Takeuchi
    • 雑誌名

      Advanced Robotics

      巻: 33 号: 3-4 ページ: 134-152

    • DOI

      10.1080/01691864.2019.1571438

    • 関連する報告書
      2018 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] AIC for the non-concave penalized likelihood method2019

    • 著者名/発表者名
      Umezu Yuta、Shimizu Yusuke、Masuda Hiroki、Ninomiya Yoshiyuki
    • 雑誌名

      Annals of the Institute of Statistical Mathematics

      巻: 71 号: 2 ページ: 247-274

    • DOI

      10.1007/s10463-018-0649-x

    • 関連する報告書
      2018 実施状況報告書
    • 査読あり
  • [雑誌論文] Post Selection Inference with Kernels2018

    • 著者名/発表者名
      Makoto Yamada, Yuta Umezu, Kenji Fukumizu, Ichiro Takeuchi
    • 雑誌名

      Proceedings of Machine Learning Research

      巻: 84 ページ: 152-160

    • 関連する報告書
      2018 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Can AI predict animal movements? Filling gaps in animal trajectories using inverse reinforcement learning2018

    • 著者名/発表者名
      Tsubasa Hirakawa, Takayoshi Yamashita, Toru Tamaki, Hironobu Fujiyoshi, Yuta Umezu, Ichiro Takeuchi, Sakiko Matsumoto, Ken Yoda
    • 雑誌名

      Ecosphere

      巻: 9 号: 10 ページ: 1-24

    • DOI

      10.1002/ecs2.2447

    • 関連する報告書
      2018 実施状況報告書
    • 査読あり / オープンアクセス
  • [学会発表] 超高次元加法モデルにおけるモデル選択2020

    • 著者名/発表者名
      梅津佑太
    • 学会等名
      2020年度統計関連学会連合大会
    • 関連する報告書
      2020 実績報告書
  • [学会発表] Sparse Regularization Method and Information Criterion2020

    • 著者名/発表者名
      梅津佑太
    • 学会等名
      2020年度統計関連学会連合大会
    • 関連する報告書
      2020 実績報告書
    • 招待講演
  • [学会発表] カーネル法に基づく超高次元モデル選択2020

    • 著者名/発表者名
      梅津佑太
    • 学会等名
      2020年度科研費シンポジウム「多様な分野のデータに対する統計科学・機械学習的アプローチ」
    • 関連する報告書
      2020 実績報告書
  • [学会発表] 超高次元スパース加法モデルにおける変数選択2019

    • 著者名/発表者名
      梅津佑太
    • 学会等名
      科研費シンポジウム「統計学と機械学習の数理と展開」
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] 超高次元加法モデルにおける変数選択2019

    • 著者名/発表者名
      梅津佑太
    • 学会等名
      第22回情報論的学習理論ワークショップ(IBIS2019)
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] Selective Inference for Change Point Detection in Multi-dimensional Sequences2018

    • 著者名/発表者名
      Yuta Umezu
    • 学会等名
      Chile-Japan Academic Forum 2018
    • 関連する報告書
      2018 実施状況報告書
    • 国際学会 / 招待講演
  • [学会発表] Selective Inference に基づく変化点検出とその応用2018

    • 著者名/発表者名
      梅津佑太, 竹内一郎
    • 学会等名
      日本応用数理学会2018年度年会
    • 関連する報告書
      2018 実施状況報告書
    • 招待講演
  • [学会発表] Selective Inference に基づく多変量系列の変化点検出2018

    • 著者名/発表者名
      梅津佑太
    • 学会等名
      日本行動計量学会第 46 回大会
    • 関連する報告書
      2018 実施状況報告書
    • 招待講演
  • [学会発表] Selective Inference に基づくスパース線形回帰モデルにおける能動学習2018

    • 著者名/発表者名
      梅津佑太, 竹内一郎
    • 学会等名
      第21回情報論的学習理論ワークショップ (IBIS 2018)
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] Selective Inference under the Local Alternative2018

    • 著者名/発表者名
      梅津佑太, 竹内一郎
    • 学会等名
      2018年度 統計関連学会連合大会
    • 関連する報告書
      2018 実施状況報告書
  • [図書] 大規模計算時代の統計推論2020

    • 著者名/発表者名
      Bradley Efron、Trevor Hastie、藤澤 洋徳、井手 剛、井尻 善久、井手 剛、牛久 祥孝、梅津 佑太、大塚 琢馬、尾林 慶一、川野 秀一、田栗 正隆、竹内 孝、橋本 敦史、藤澤 洋徳、矢野 恵佑
    • 総ページ数
      600
    • 出版者
      共立出版
    • ISBN
      9784320114340
    • 関連する報告書
      2020 実績報告書
  • [図書] スパース回帰分析とパターン認識2020

    • 著者名/発表者名
      梅津 佑太, 西井 龍映, 上田 勇祐
    • 総ページ数
      208
    • 出版者
      講談社サイエンティフィク
    • ISBN
      9784065186206
    • 関連する報告書
      2019 実施状況報告書

URL: 

公開日: 2018-04-23   更新日: 2022-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi