• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2019 Fiscal Year Research-status Report

Model selection for Bayesian sparse estimation in hierarchical models

Research Project

Project/Area Number 19K20363
Research InstitutionThe Institute of Statistical Mathematics

Principal Investigator

坂田 綾香  統計数理研究所, 数理・推論研究系, 助教 (80733071)

Project Period (FY) 2019-04-01 – 2022-03-31
Keywords階層ベイズ / belief propagation / グループテスト
Outline of Annual Research Achievements

2019年度は、スパース推定の問題群の一つであるグループテストについて、階層ベイズモデルを導入した解析を行った。グループテストとは、検体検査において患者が感染しているかしていないかを特定する際に、検体のプールを構成し、プールに対するテストから患者の状態を特定する方法である。患者の感染確率が十分小さいとき、グループテストを用いると患者数よりも少ない数の検査結果から患者の状態を特定することができる。
グループテストにおいては、患者の状態特定も重要であるが、有病率(集団内における感染者の割合)の推定も一つの課題である。本研究では、患者の状態と有病率の同時推定を階層ベイズモデルにより定式化した。そして階層ベイズモデルにおいてbelief propagationと呼ぶアルゴリズムを構成し、近似的に低計算量で推定する方法を提案した。
一般に、テスト結果には有限の確率でエラーが含まれる。提案手法を用いると、検査におけるエラーが訂正され、もとのテストにおける誤り確率よりも、推定の誤り確率の方が低くなることがわかった。特に真陽性確率は、belief propagationとブーツストラップ法を組み合わせることで、さらに改善されることがわかった。
このテストにおける誤り確率も、モデルのハイパーパラメータであり未知である場合も考えられる。そこでbelief propagationにexpectation maximizationを組み合わせ、ハイパーパラメータ推定をしながら患者の特定をする方法を考えた。この方法を実験した結果、広いパラメータ領域で真の値を復元することができた。
一方で別の手法として、モデル選択規準からパラメータ値を決めることもできる。2020年度はベイズ予測分布からパラメータの値を考察し、より効率よい推定法を模索していきたい。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

当初の予定では、階層ベイズモデルを導入する問題として、グループテストは候補に入っていなかった。しかし、その数理的構造を考察した結果、階層ベイズモデルによる推定およびbelief propagationによる実装と非常に相性が良く、初年度はこの問題上で統計的モデリングの研究を行うこととした。
当初の予定とは異なり、患者推定における事前分布としては、ベルヌーイ分布を導入している。その理由は、有病率の推定という目標にベルヌーイ分布が適切であったためである。そのため、事前分布の検討という点までは、2019年度は至っていない。さらに、ベルヌーイ分布に含まれるハイパーパラメータの推定のため、ベータ分布をハイパープライアーとした。これは従来のベイズ推定の方法論に基づくものであるが、ハイパープライアーつきのモデルをbelief propagationで実装するという点に、本研究の新規性がある。
初年度の解析結果に基づくプログラム群は、全て実装しGithubに公開することができた。特に階層ベイズモデルに対してbelief propagationを適用した例はあまりなく、本研究での開発手法が他の問題に対しても有効な解法として用いられると期待している。また、研究成果は論文にまとめ、学術誌に投稿中である。

Strategy for Future Research Activity

2020年度はグループテストの研究を進めつつ、他の問題設定についても研究を行い、モデリング理論についての理解を深めていきたい。
グループテストに関しては、適応的グループテストの研究を行う予定である。これは、前ステップの検査結果に基づいて次のグループを決める、逐次的な検査方法である。その数理はベイズ最適化などと共通する点がある。現在のところ、ベイズ予測分布を使った適応的テストが可能ではないかと考えている。ベイズ予測分布は、統計的モデリングの一つの指標であるが、その推定量はpredictive information criterion (PIC)とも呼ばれる。すなわち、与えられたデータから推定したモデルが未知のデータにどのくらい当てはまるのかの指標である。通常は、PICを最小化するようにモデルパラメータを決めるが、適応的グループテストについてはベイズ予測分布では当てはまらないようなテストを構成する必要があると考える。すなわち、これまでの推定結果では説明できないようなデータを取り入れ、次の推定を行うことで、不確実性を下げられると期待している。既存の適応的グループテストは、検査にノイズが含まれない場合を考慮しているものが多いが、ベイズ推定の枠組みで適応的グループテストの効率的アルゴリズムを開発することを目標とする。

Causes of Carryover

2月末~3月の研究集会や出張が、新型コロナウイルスの影響で全て中止となり、旅費が余った。

  • Research Products

    (4 results)

All 2019

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (3 results)

  • [Journal Article] Cross validation in sparse linear regression with piecewise continuous nonconvex penalties and its acceleration2019

    • Author(s)
      Tomoyuki Obuchi and Ayaka Sakata
    • Journal Title

      Journal of Physics A: Mathematical and Theoretical

      Volume: 52 Pages: 414003

    • DOI

      https://doi.org/10.1088/1751-8121/ab3e89

    • Peer Reviewed / Open Access
  • [Presentation] Approximation of cross-validation error for linear regression with piecewise continuous nonconvex penalties2019

    • Author(s)
      Ayaka Sakata and Tomoyuki Obuchi
    • Organizer
      統計関連学会連合大会
  • [Presentation] 区分的連続非凸正則化付き線形回帰の近似的交差検証法とスピングラス転移2019

    • Author(s)
      小渕智之、坂田綾香
    • Organizer
      日本物理学会2019年秋季大会
  • [Presentation] 区分的連続非凸正則化付き線形回帰の近似的交差検証法とスピングラス転移2019

    • Author(s)
      小渕智之、坂田綾香
    • Organizer
      IBIS2019

URL: 

Published: 2021-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi