研究概要 |
ある広領域に含まれるm個の地域i=1,...,mについて,事故数や疾病数などのデータx[i]が,付随する共変量より予測される期待度数μ[i]とともに得られているとする。事故や疾病が集積する地域では,x[i]がμ[i]よりも有意に大きい値をとると考えられる.そのような地域はホットスポットとよばれ,そのような地域を統計量(スキャン統計量)を用いて統計的に検出することがここでの問題である.これらのホットスポットは,単一地域にとどまらないでクラスターをなす場合が多い.そのため,隣接する地域を併合した値もスキャンの対象とし,対応するスキャン統計量を求め,多重性調整p値によって有意性を判定する必要がある. ところでこの多重性調整p値は数式としては多重積分(和文)で表されるものであり,その厳密な数値計算を定義式通りに行うのは計算量の観点から現実的ではない.現状の空間疫学のデータ解析ではモンテカルロシミュレーションを行っているが,ホットスポットの判定が必要となるのは分布の裾領域に対応するため,素朴な乱数シミュレーションではその乱数の個数を相当増やしても,なかなか精度を出すことができないという問題がある. 本研究では,このような多次元数値計算を高速に行うために,マルコフ性に基づく逐次数値積分の利用を試みた.最初に地域の隣接関係や地域間距離により無向グラフを定義し,そのグラフをコーダル拡大し,そのジャンクション木を求めるアルゴリズムを開発することによってマルコフ性を抽出した.次に条件付および無条件p値がみたす漸化式を導き,それを用いて逐次数値積分が原理的に可能であることを見いだした.特に本年度は,プログラム言語Rを用いてプロトタイププログラムを作成し,提案する逐次数値積分が正しいものであることを確認した.さらにいくつかのテストデータについて計算時間の評価を行った.提案法は計算量を大きく低減することが確認できたが,一方で実データに対しては実用的な計算時間で計算できるものではなく,今後理論・アルゴリズム,インプリメンテーションの両方の観点から実用化に向けたさらなる研究が必要であることが分った.
|