我々が提案してきた連鎖不平衡を利用した関連解析、ハプロタイプ解析の一連の流れを統合的分析方法として整備し、新しい理論構築も積極的に組み入れる。 具体的な分析方法としてDNAデータの中の代表的なSNPマーカーについて、連鎖不平衡係数などの指標によるブロックとして同定する方法、ブロック同定によりその中の代表的なマーカーを最適に選択するhtSNPsを選択する方法などを構築してきた。 より大量なデータへの拡張に対応するためには、今までは遺伝解析者がよく用いるLinux環境の特殊なフォーマットが多かったが、この2.3年では統計解析者にも馴染みの深いR環境で実行できる遺伝統計解析パッケージが多く提供され、一般の統計関係者に取り組みやすくなってきている。本研究課題の、より円滑な推進を整備するために、大量SNPsデータにおける独立性の検定の超高速計算や-log(p値)での染色体ごとのプロット、連鎖不平衡マップなどのR環境での実行や活用をまとめ、これらに対してもブロック同定やhtSNPsを行った解析結果を掲載したものが、計算機統計学22(2)に採択され、掲載された。 また、ブロック同定に対して、Echelon解析を用いていたが、この空間統計手法の応用として、疫学系の大規模データに対応させた手法にとりくんだ。この結果、遺伝統計解析で我々が標室した方法が、より一般的な疫学・公衆衛生系のデータで有効なことがはっきりと示せた。このデータ解析をまとめたものも計算機統計学23(1)に採択され、掲載された。
|