研究課題/領域番号 |
19K20363
|
研究機関 | 統計数理研究所 |
研究代表者 |
坂田 綾香 統計数理研究所, 数理・推論研究系, 助教 (80733071)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | 階層ベイズ / belief propagation / グループテスト |
研究実績の概要 |
2019年度は、スパース推定の問題群の一つであるグループテストについて、階層ベイズモデルを導入した解析を行った。グループテストとは、検体検査において患者が感染しているかしていないかを特定する際に、検体のプールを構成し、プールに対するテストから患者の状態を特定する方法である。患者の感染確率が十分小さいとき、グループテストを用いると患者数よりも少ない数の検査結果から患者の状態を特定することができる。 グループテストにおいては、患者の状態特定も重要であるが、有病率(集団内における感染者の割合)の推定も一つの課題である。本研究では、患者の状態と有病率の同時推定を階層ベイズモデルにより定式化した。そして階層ベイズモデルにおいてbelief propagationと呼ぶアルゴリズムを構成し、近似的に低計算量で推定する方法を提案した。 一般に、テスト結果には有限の確率でエラーが含まれる。提案手法を用いると、検査におけるエラーが訂正され、もとのテストにおける誤り確率よりも、推定の誤り確率の方が低くなることがわかった。特に真陽性確率は、belief propagationとブーツストラップ法を組み合わせることで、さらに改善されることがわかった。 このテストにおける誤り確率も、モデルのハイパーパラメータであり未知である場合も考えられる。そこでbelief propagationにexpectation maximizationを組み合わせ、ハイパーパラメータ推定をしながら患者の特定をする方法を考えた。この方法を実験した結果、広いパラメータ領域で真の値を復元することができた。 一方で別の手法として、モデル選択規準からパラメータ値を決めることもできる。2020年度はベイズ予測分布からパラメータの値を考察し、より効率よい推定法を模索していきたい。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の予定では、階層ベイズモデルを導入する問題として、グループテストは候補に入っていなかった。しかし、その数理的構造を考察した結果、階層ベイズモデルによる推定およびbelief propagationによる実装と非常に相性が良く、初年度はこの問題上で統計的モデリングの研究を行うこととした。 当初の予定とは異なり、患者推定における事前分布としては、ベルヌーイ分布を導入している。その理由は、有病率の推定という目標にベルヌーイ分布が適切であったためである。そのため、事前分布の検討という点までは、2019年度は至っていない。さらに、ベルヌーイ分布に含まれるハイパーパラメータの推定のため、ベータ分布をハイパープライアーとした。これは従来のベイズ推定の方法論に基づくものであるが、ハイパープライアーつきのモデルをbelief propagationで実装するという点に、本研究の新規性がある。 初年度の解析結果に基づくプログラム群は、全て実装しGithubに公開することができた。特に階層ベイズモデルに対してbelief propagationを適用した例はあまりなく、本研究での開発手法が他の問題に対しても有効な解法として用いられると期待している。また、研究成果は論文にまとめ、学術誌に投稿中である。
|
今後の研究の推進方策 |
2020年度はグループテストの研究を進めつつ、他の問題設定についても研究を行い、モデリング理論についての理解を深めていきたい。 グループテストに関しては、適応的グループテストの研究を行う予定である。これは、前ステップの検査結果に基づいて次のグループを決める、逐次的な検査方法である。その数理はベイズ最適化などと共通する点がある。現在のところ、ベイズ予測分布を使った適応的テストが可能ではないかと考えている。ベイズ予測分布は、統計的モデリングの一つの指標であるが、その推定量はpredictive information criterion (PIC)とも呼ばれる。すなわち、与えられたデータから推定したモデルが未知のデータにどのくらい当てはまるのかの指標である。通常は、PICを最小化するようにモデルパラメータを決めるが、適応的グループテストについてはベイズ予測分布では当てはまらないようなテストを構成する必要があると考える。すなわち、これまでの推定結果では説明できないようなデータを取り入れ、次の推定を行うことで、不確実性を下げられると期待している。既存の適応的グループテストは、検査にノイズが含まれない場合を考慮しているものが多いが、ベイズ推定の枠組みで適応的グループテストの効率的アルゴリズムを開発することを目標とする。
|
次年度使用額が生じた理由 |
2月末~3月の研究集会や出張が、新型コロナウイルスの影響で全て中止となり、旅費が余った。
|