• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実施状況報告書

構造制約に着目した高次元カウントデータの未知母数推定法と不確実性評価法の構築

研究課題

研究課題/領域番号 19K20222
研究機関東京大学

研究代表者

矢野 恵佑  東京大学, 大学院情報理工学系研究科, 助教 (20806070)

研究期間 (年度) 2019-04-01 – 2023-03-31
キーワード高次元統計 / カウントデータ / スパースモデリング / 擬ベイズ法
研究実績の概要

高次元カウントデータに関する高精度かつ高速な統計解析手法の構築に着手した。高次元カウントデータは多岐にわたる学術分野や実社会で現れる。例えば、商品の購入者数、犯罪発生件数、地震の発生件数、遺伝子の発現数、太陽の黒点数などである。
本年度はゼロ過剰性を持つ高次元カウントデータの高精度な母数推定法を構築した。高次元カウントデータは、ゼロあるいはゼロに近いカウントを過剰にもつというゼロ過剰という性質をしばしば持っている。本研究では、ゼロ過剰という性質を「疎性」の枠組みで捉え、スパイクースラブ型の事前分布を利用したベイズ推論法を提案した。ポアソン分布のガンマ分布混合が負の二項分布になることに着目し、提案手法からの高速な標本抽出法を開発した。提案手法の実データでの性能検証を、東京都のオープンデータ(東京都におけるスリの発生件数)と遺伝子発現データを用いて行った。
スパイクースラブ型の事前分布は通常の高次元回帰の文脈で非常によく使われている。しかし、本研究の重要な理論的結果として、「事前分布の裾の重さはデータの分布の裾の重さよりも重くしなければ精度が悪化してしまう」ということが分かった。この結果はスパイクースラブ型の事前分布の適用に重要な示唆を与えるものである。更に、驚くべき性質として、疎性に関する情報を解析者が知らなかったとしても、提案手法では精度を落とすことなく推論を行うことができる、すなわち、疎性に対する適応性をもつことが分かった。疎性に対する適用性は応用上非常に重要であるにも関わらず理論的にその性質が示されている手法はごく僅かである。特に高次元カウントデータで示したのは本研究が初である。
また、次年度以降に向けて、高次元カウントデータ以外の「高次元かつ構造制約を持つデータ」に関する手法開発および理論解析を開始した。

現在までの達成度
現在までの達成度

2: おおむね順調に進展している

理由

当初の研究計画通り進んでいる。

今後の研究の推進方策

初年度に明らかになった内容をもとに、高次元カウントデータ以外の「高次元かつ構造制約を持つデータ」に関する手法開発および理論解析を開始する。

次年度使用額が生じた理由

1月以降の国内出張および海外渡航自粛に伴い国内外での講演および海外での共同研究が延期となったため。これらの繰越額は次年度以降の研究の推進に充てる。

  • 研究成果

    (11件)

すべて 2020 2019 その他

すべて 国際共同研究 (1件) 雑誌論文 (2件) (うち国際共著 1件、 査読あり 2件、 オープンアクセス 1件) 学会発表 (8件) (うち国際学会 7件、 招待講演 7件)

  • [国際共同研究] University of Southern California/Data Sciences and Operations(米国)

    • 国名
      米国
    • 外国機関名
      University of Southern California/Data Sciences and Operations
  • [雑誌論文] On frequentist coverage errors of Bayesian credible sets in moderately high dimensions2020

    • 著者名/発表者名
      Keisuke Yano and Kengo Kato
    • 雑誌名

      Bernoulli

      巻: 26 ページ: 616-641

    • DOI

      10.3150/19-BEJ1142

    • 査読あり / 国際共著
  • [雑誌論文] Adjacency-based regularization for partially ranked data with non-ignorable missing2020

    • 著者名/発表者名
      Kento Nakamura, Keisuke Yano, and Fumiyasu Komaki
    • 雑誌名

      Computational Statistics & Data Analysis

      巻: 145 ページ: 106905

    • DOI

      10.1016/j.csda.2019.106905

    • 査読あり / オープンアクセス
  • [学会発表] Risk-estimation based predictive densities for heteroskedastic hierarchical models2019

    • 著者名/発表者名
      Keisuke Yano
    • 学会等名
      ICSA 2019, China
    • 国際学会 / 招待講演
  • [学会発表] On estimation and prediction for high-dimensional Poisson models with quasi-zero inflation2019

    • 著者名/発表者名
      Keisuke Yano
    • 学会等名
      CMStatistics 2019 , UK
    • 国際学会 / 招待講演
  • [学会発表] On frequentist coverage errors of Bayesian credible sets in moderately high dimensions, Italy, 24 July (22-26 July), 2019.2019

    • 著者名/発表者名
      Keisuke Yano
    • 学会等名
      European Meeting of Statisticians (EMS 2019), Italy
    • 国際学会 / 招待講演
  • [学会発表] The Berry--Esseen type bound for the Bernstein--von Mises theorem in moderately high dimensions2019

    • 著者名/発表者名
      Keisuke Yano
    • 学会等名
      EAC-ISBA 2019, Japan
    • 国際学会 / 招待講演
  • [学会発表] On the construction of adaptive predictive densities for sparse count data2019

    • 著者名/発表者名
      Keisuke Yano
    • 学会等名
      EcoSta 2019, Taiwan
    • 国際学会 / 招待講演
  • [学会発表] Adaptive minimax predictive density for sparse Poisson models2019

    • 著者名/発表者名
      Keisuke Yano
    • 学会等名
      Banff workshop "New and Evolving Roles of Shrinkage in Large-Scale Prediction and Inference (19w5188)", Canada
    • 国際学会 / 招待講演
  • [学会発表] Earthquake detection using deep learning for continuous seismic network records2019

    • 著者名/発表者名
      Keisuke Yano, Takahiro Shiina, Sumito Kurata, Aitaro Kato, Fumiyasu Komaki, Shin'ichi Sakai, Naoshi Hirata
    • 学会等名
      StatSei11, Japan
    • 国際学会 / 招待講演
  • [学会発表] ベイズl1トレンドフィルタリングによるスロースリップ自動検知2019

    • 著者名/発表者名
      矢野恵佑, 加納将行
    • 学会等名
      固体地球科学データ同化に関する研究会

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi