2020 Fiscal Year Annual Research Report
Statistical Methodology for Stabilizing Grouped Data Analysis
Project/Area Number |
18K12757
|
Research Institution | The University of Tokyo |
Principal Investigator |
菅澤 翔之助 東京大学, 空間情報科学研究センター, 准教授 (50782380)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 階層モデル / ロバスト統計 / 異質性 / ベイズ統計 |
Outline of Annual Research Achievements |
個人や地域などの属性に基づいてグループ分けされる形式のデータは、グループデータまたはクラスターデータと呼ばれ、社会科学をはじめ、経済学・医学・環境学などの多様な科学分野におけて頻繁に現れるデータ形式である。本研究課題は、このようなデータに対する既存の統計解析手法が抱えるいくつかの問題点に焦点を当て、その解決を目指すものである。今年度はデータの持つ異質的性質に注目し、具体的には以下のような課題に取り組んだ。 (A) 空間データに対して空間的な異質性を考慮した代表的な分析手法として地理的加重回帰がある。この方法は数値的な不安定性や大規模データにおける計算コストの問題点が知られている。このような課題を解決するために空間クラスタリングと回帰分析を同時に実行する革新的な方法論を開発した。 (B) データに外れ値が含まれている状況では、t分布のような裾の厚い分布を誤差分布として用いることで頑健にパラメータ推定が実行できることが知られている。一方で、ベイズ分析におけるある種の頑健性を担保するには、t分布よりも裾が厚い分布が必要であることが知られているが、現状提案されている誤差分布は事後分布を計算するが容易ではない。そこで、簡易なマルコフ連鎖モンテカルロ法で事後分布の計算が実行できる誤差分布のクラスを新たに開発した。この分布によりクラスター構造を持ったデータに対しても現実的な計算コストで頑健なベイズ分析が実行できるようになった。 (C) データの異質性を表現する統計モデルのクラスとして有限混合モデルがある。外れ値に影響を受けずに有限混合モデルを推定するのは一般的に容易ではないが、重み付き完全推定方程式と呼ばれる概念を導入し、それを解くための繰り返しアルゴリズムを開発した。
|