研究概要 |
今年度の主結果の二つは,ゲノム科学のための多重検定法の構成と非正則な統計モデルに基づく林分成長分析法の構築である.以下では,完成に至った前者について説明する. 多重検定とは複数の検定を同時におこなう手順である.ゲノム科学などの分野では,その膨大なデータゆえに,各検定間の相関が高くかつその数が多いような多重検定がよく必要とされる.例えば病気と遺伝子の関連を調べる問題では,対立遺伝子(遺伝子の場所)ごとに検定が構成され,上述の問題となる.多重検定で必要となる棄却確率の評価は,多重積分により与えることができるが,検定の数が多いとその計算は実質不可能となる.このように検定の数が多い場合は,(Bonferroniの不等式による)棄却確率の上界の簡便な評価が用いられ,保守的な検定が構成されるのが通常であるが,相関が高いとその上界は真の棄却確率と大きく隔たることになる.本結果では,棄却確率を幾何的に表現することにより,そのタイトな上界を与えている.この上界の評価式は多重積分を使わないため,数値計算的にも(Bonferroniの不等式による)従来の評価と同等の簡便性をもっている.また,相関が1に近づくという漸近論に基づいているため,相関が高いという設定において理論的な妥当性をもった評価式となっている.そしてこの評価を,病気と遺伝子の関連を調べるQTLマッピングの問題およびDNAシーケンスにおける変化領域検知の問題に適用し,数値実験ならびに実データ解析において過去の評価方法に比べて格段にタイトな上界を与えることを示している.
|