2014 Fiscal Year Research-status Report
時空間構造を持ったスキャン統計量の同時確率計算の実用化
Project/Area Number |
24500356
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
栗木 哲 統計数理研究所, 数理・推論研究系, 教授 (90195545)
|
Project Period (FY) |
2012-04-01 – 2017-03-31
|
Keywords | スキャン統計量 / 多重比較 / コーダルグラフ |
Outline of Annual Research Achievements |
本研究は,時間的,空間的相関構造を持った確率変数の組からマルコフ性を抽出することによって,時空間スキャン統計量の多重性調整p値の高速計算法の確立を目的としている.特に空間疫学の疾病集積クラスターの同定問題への応用を念頭に置いている.いままでの研究では,スキャン統計量の空間情報から定義される無向グラフのコーダル化によってマルコフ性を抽出し,得られたマルコフ性に基づく階層的逐次数値積分を用いて,多重性調整p値や検出力が計算可能であることを明らかした.またその考え方に基づいてCプログラムを作成し,さらにその高速化を試みた.本年度はその延長として以下のことがらを行った. (i) これまでの研究は,観測値がポアソンサンプリングに基づくことを仮定し,その条件付分布としての多項分布に基づく確率計算を想定していた.しかしながら本研究手法は,ガウス分布の条件付分布である縮退したガウス分布,ガンマ分布の条件付き分布であるディリクレ分布,2項分布の条件付き分布である多変数超幾何,負の2項分布の条件付き分布であるディリクレ多項分布でも有効であることを示した. (ii) いままでは計算量のオーダ評価のみを行っていたが,必要とされる記憶容量のオーダの評価も行った. (iii) 多項分布やポアソン分布の隣接和の分布については,Naus の古典的な結果が知られている (Wallenstein and Naus, 1973; Neff and Naus, 1980). Naus の問題設定においても,本提案手法は有効であることを確認した.また Wallenstein (1980) の流産件数データを再解析した. (iv) Tango (2010) の山形県の胆嚢ガン件数データを再解析した. (v) 結果を国際学会 7th International Conference of the ERCIM WG on Computational and Methodological Statistics (ERCIM 2014) にて口頭発表した.また投稿準備のためのテクニカルレポートを用意した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究課題の当初の目的,すなわちアルゴリズムの開発とそのプロトタイププログラムの作成を達成するとともに,本年度の研究成果で述べたような理論的結果も得られた.またデータ解析も行った.学会発表,論文発表準備も進んでいる.
|
Strategy for Future Research Activity |
(i) 相関構造を持った統計量の最大値分布の計算にはアブストラクトチューブとよばれる包除原理が利用可能である.スキャン統計量のp値計算に,このアブストラクトチューブのテクニックが有効かどうかを検討する.アブストラクトチューブはパーシステントホモロジーとの関連でも注目を集めているが,コーダルグラフとの関係など分からないことも多く,それらについて本課題との関連で調べることも目標とする. (ii) 投稿論文の刊行をはかる.
|
Causes of Carryover |
基盤校費を消耗品,文献資料購入,国内学会発表旅費にあてることができた.
|
Expenditure Plan for Carryover Budget |
計算機周辺機器,数値計算ソフトウェアの保守を購入予定である.文献,論文は継続的に購入する必要がある.執筆した論文のための英文校閲料を必要とする.研究補助の謝金も必要である.国際学会IMS-Chinaで発表予定であり,そのための旅費を必要とする.
|