2019 Fiscal Year Research-status Report
構造制約に着目した高次元カウントデータの未知母数推定法と不確実性評価法の構築
Project/Area Number |
19K20222
|
Research Institution | The University of Tokyo |
Principal Investigator |
矢野 恵佑 東京大学, 大学院情報理工学系研究科, 助教 (20806070)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | 高次元統計 / カウントデータ / スパースモデリング / 擬ベイズ法 |
Outline of Annual Research Achievements |
高次元カウントデータに関する高精度かつ高速な統計解析手法の構築に着手した。高次元カウントデータは多岐にわたる学術分野や実社会で現れる。例えば、商品の購入者数、犯罪発生件数、地震の発生件数、遺伝子の発現数、太陽の黒点数などである。 本年度はゼロ過剰性を持つ高次元カウントデータの高精度な母数推定法を構築した。高次元カウントデータは、ゼロあるいはゼロに近いカウントを過剰にもつというゼロ過剰という性質をしばしば持っている。本研究では、ゼロ過剰という性質を「疎性」の枠組みで捉え、スパイクースラブ型の事前分布を利用したベイズ推論法を提案した。ポアソン分布のガンマ分布混合が負の二項分布になることに着目し、提案手法からの高速な標本抽出法を開発した。提案手法の実データでの性能検証を、東京都のオープンデータ(東京都におけるスリの発生件数)と遺伝子発現データを用いて行った。 スパイクースラブ型の事前分布は通常の高次元回帰の文脈で非常によく使われている。しかし、本研究の重要な理論的結果として、「事前分布の裾の重さはデータの分布の裾の重さよりも重くしなければ精度が悪化してしまう」ということが分かった。この結果はスパイクースラブ型の事前分布の適用に重要な示唆を与えるものである。更に、驚くべき性質として、疎性に関する情報を解析者が知らなかったとしても、提案手法では精度を落とすことなく推論を行うことができる、すなわち、疎性に対する適応性をもつことが分かった。疎性に対する適用性は応用上非常に重要であるにも関わらず理論的にその性質が示されている手法はごく僅かである。特に高次元カウントデータで示したのは本研究が初である。 また、次年度以降に向けて、高次元カウントデータ以外の「高次元かつ構造制約を持つデータ」に関する手法開発および理論解析を開始した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の研究計画通り進んでいる。
|
Strategy for Future Research Activity |
初年度に明らかになった内容をもとに、高次元カウントデータ以外の「高次元かつ構造制約を持つデータ」に関する手法開発および理論解析を開始する。
|
Causes of Carryover |
1月以降の国内出張および海外渡航自粛に伴い国内外での講演および海外での共同研究が延期となったため。これらの繰越額は次年度以降の研究の推進に充てる。
|