GWASにおいて検出力の面から絞り込むことはMAFによるSNPの大量破棄となってしまうかもしれない。我々の本研究によるアプローチが有効であると考える。変量の絞り込みを遺伝的な構造の面からアプローチする方法である。SNPはそれぞれが独立の変数と考えられる訳ではなく、同じ染色体上で近い近傍にあるSNPと強い関係を保っており、連鎖不平衡(LD)と呼ぶ。LDの強い領域(LDブロックと呼ぶ)を同定する方法が導かれ、代表的な方法がHaploviewというフリーのGUIソフトウェアに実装されているGabriel et al.(2002)の信頼区間ベースで考えられたstrong LDを同定するものである。これに対して、ハプロタイプ推定を繰り返し行うKamatani et al.(2004)の手法があるが、LDブロックを構成する最小ブロックについて連鎖不平衡係数D'>0.95と決め打ちしているところに疑問を持つ。我々は空間構造を把握するスキャン方法を応用して、大規模なLDブロックを同定する方法を提案し、彼らの方法よりも計算量のオーダーが小さいことを示した。 また、LDブロックを同定すれば、その中の数個のSNPで他の変量は説明する代わりとなることが分かっている。このようなSNPを代表SNPと呼び、空間構造を把握するスキャン方法を応用する方法を提案した。 代表SNPから更にハプロタイプを推定することで、レアな遺伝変異であるSNPの検出を可能にする場合もある。そのようなことのためには各個人のハプロタイプ対、ディプロタイプ形を推定し、関連解析を行うことが重要となる。単一な量的表現型においてはShibata et al.(2004)があるが、我々は複数の量的表現型についても厳密に発現モデルを組み込んだ関連解析を可能とした。これは先行研究であるQTLmarcよりも明らかに妥当な解析結果を得ている。
|