研究課題
個人や地域などの属性に基づいてグループ分けされる形式のデータは、グループデータまたはクラスターデータと呼ばれ、社会科学をはじめ、経済学・医学・環境学などの多様な科学分野におけて頻繁に現れるデータ形式である。本研究課題は、このようなデータに対する既存の統計解析手法が抱えるいくつかの問題点に焦点を当て、その解決を目指すものである。今年度はデータの持つ異質的性質に注目し、具体的には以下のような課題に取り組んだ。(A) 空間データに対して空間的な異質性を考慮した代表的な分析手法として地理的加重回帰がある。この方法は数値的な不安定性や大規模データにおける計算コストの問題点が知られている。このような課題を解決するために空間クラスタリングと回帰分析を同時に実行する革新的な方法論を開発した。(B) データに外れ値が含まれている状況では、t分布のような裾の厚い分布を誤差分布として用いることで頑健にパラメータ推定が実行できることが知られている。一方で、ベイズ分析におけるある種の頑健性を担保するには、t分布よりも裾が厚い分布が必要であることが知られているが、現状提案されている誤差分布は事後分布を計算するが容易ではない。そこで、簡易なマルコフ連鎖モンテカルロ法で事後分布の計算が実行できる誤差分布のクラスを新たに開発した。この分布によりクラスター構造を持ったデータに対しても現実的な計算コストで頑健なベイズ分析が実行できるようになった。(C) データの異質性を表現する統計モデルのクラスとして有限混合モデルがある。外れ値に影響を受けずに有限混合モデルを推定するのは一般的に容易ではないが、重み付き完全推定方程式と呼ばれる概念を導入し、それを解くための繰り返しアルゴリズムを開発した。
すべて 2021 2020 その他
すべて 国際共同研究 (2件) 雑誌論文 (9件) (うち国際共著 2件、 査読あり 9件、 オープンアクセス 3件) 学会発表 (4件) (うち国際学会 1件、 招待講演 1件) 備考 (1件)
Computational Statistics & Data Analysis
巻: 153 ページ: 107068~107068
10.1016/j.csda.2020.107068
Journal of Business & Economic Statistics
巻: NA ページ: 1~16
10.1080/07350015.2021.1883438
Bayesian Analysis
巻: NA ページ: NA
10.1214/21-BA1263
Entropy
巻: 22 ページ: 661~661
10.3390/e22060661
Biometrics
巻: 77 ページ: 249~257
10.1111/biom.13279
BioScience Trends
巻: 14 ページ: 174~181
10.5582/bst.2020.03133
Journal of the American Statistical Association
巻: NA ページ: 1~12
10.1080/01621459.2020.1777136
Statistica Sinica
10.5705/ss.202019.0239
Journal of Survey Statistics and Methodology
10.1093/jssam/smaa038
https://sites.google.com/view/ssugasawa