研究課題/領域番号 |
24500356
|
研究機関 | 統計数理研究所 |
研究代表者 |
栗木 哲 統計数理研究所, 大学共同利用機関等の部局等, 教授 (90195545)
|
キーワード | スキャン統計量 / 多重性調整 / コーダルグラフ |
研究概要 |
本研究は空間的相関構造を持った確率変数の組からマルコフ性を抽出することによって,時空間スキャン統計量の同時分布の高速計算法の確立を目的とする.特に空間疫学の疾病集積クラスターの同定問題で懸案となっている多重性調整p値と検出力の正確計算の実用化を最終的な目標としている. 昨年までの研究で,スキャン統計量の空間情報から定義されるグラフのコーダル化によってマルコフ性を抽出し,得られたマルコフ性に基づく階層的逐次数値積分を用いて,多重性調整p値や検出力が原理的には計算できることを明らかした.またC言語によるプロトタイププログラムを作成した.しかしながらそのプログラムは実用的な速度ではないため,本年度は高速化のための検討を行った. 最初に,現在得られているアルゴリズムの計算量の評価を行った.インシデント数の総数を N, コーダル化したグラフの i 番目のクリークの頂点の数を c(i),i番目のクリークを親とする頂点の数を pa(i) とするとき,計算量は N の max(c(i)+pa(i)) 乗に比例するものであった.実際に数値計算の結果によると,N が100~200の場合,max(c(i)+pa(i)) が高々6の場合には計算可能であったが,それよりも大きい場合には不可能であった.それはこの計算量の考察とも合致する. そこでプログラムの高速化のために,以下のことを行った.(i) コーダルグラフにおいて,親クリークの指定は一意ではない.そのためなるべく pa(i) が大きくならないようなアルゴリズムを工夫した. (ii) c(i) は,スキャンウィンドウが与えられればそれにより決まる量である.そこで,逆に c(i) が大きくならないようなスキャンウィンドウの構成について考えた.サーキュラースキャンウィンドウを修正する形で,スキャン統計量の数が多くなっても c(i) が大きくならないようなスキャンウィンドウを構成した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
第一の目標である多重性調整p値計算のプログラムを作成し,その方法が計算可能な範囲,限界を明らかにできた.
|
今後の研究の推進方策 |
(i) 最初に現段階までの成果をまとめて,国際学会発表ならびに論文執筆を行う. (ii) 計算の高速化の別のアプローチとして,プログラムコードを生成するプリプロセッサによる方法を検討する.本計算はデータに依存する階層数の for ループを必要とする.また for ループの入れ子構造もデータによって異なる.現在のプログラムは,これらの可変性に対応するために計算時間がかかっている.プリプロセッサにより最適なプログラムが生成されれば,計算が劇的に高速化される可能性がある. (iii) 階層的な相関構造を持った多数の統計量の同時分布の計算にはアブストラクトチューブ とよばれる包除原理が援用可能である.アブストラクトチューブにはまだ分からないことが多く(たとえばコーダルグラフとの関係)それらについて本課題との関連で調べる.
|
次年度の研究費の使用計画 |
基盤校費を消耗品等の購入にあてることができた.成果発表のための適当な国際学会がなかった. 学会発表のための携帯用パソコン,ならびに周辺機器,数値計算ソフトウェアの保守を購入予定である.文献,論文は継続的に購入する必要がある.国際学会での成果発表のために旅費,論文執筆のための英文校閲料を必要とする.また,数値計算データ整理,論文執筆における図表作成の補助のための謝金も必要である.
|