研究課題
本研究は、疾患発症に効果を持つ遺伝子と環境因子を、ゲノムコホート研究に典型的p>>n条件の小標本高次元データから統計学的保証を持って、柔軟かつ高速に抽出するために、高次元変数選択の枠組みを利用した遺伝統計手法を開発することを目的としている。平成26年度には、昨年に引き続き、周辺回帰とそれに引き続く罰則回帰による変数選択を組み合わせた高次元変数選択の枠組み(SIS; Sure Independence Screening)を実データ、とくに遺伝子×環境相互作用データに適用可能に拡張するために、下記の手順で解析を行った。1)ソフトウェア実装と実データでの検査実際のゲノムデータに対して、分割表の各セルを個別に評価するCell-wise Dummy Coding(CDC)と、balanced accuracyのような指標で分割表を柔軟に再構成するAdaptive Dummy Coding(ADC)の二種類のコーディング法を適用して、得られた周辺回帰ランキング統計量(尤度やオッズ比やp値)の分布を検査した。特に上位ランキング変数の抜き出し基準の統計学的検討を実施した。2)遺伝子×環境相互作用への拡張飲酒や喫煙などの生活習慣に関する環境暴露データを、順位のあるダミー変数あるいは順位のないダミー変数としてコーディングし、SNPとの分割表を集計することで、上記のSISの枠組みによるソフトウェアプログラムを遺伝子×環境相互作用の解析に拡張した。作成されたソフトウェアを用いて、実際のいくつかのゲノムワイドデータに適用し、結果のフィードバックと更なるチューニングを行った。
2: おおむね順調に進展している
疾患発症に対して、隠された強い効果として期待される「要因間(遺伝子×遺伝子あるいは遺伝子×環境)の相互作用」の解析を実現するためには、最先端の統計学分野でp>>n問題の解決のために開発されてきた高次元変数選択法のような柔軟な各種の統計手法を遺伝学分野に応用すること、さらに実際のゲノムコホートデータに適用して、統計学的保証を持って相互作用検索を実現可能にすることが必要である。そのために、これまで行ってきたゲノムデータにおける超高次元変数選択法SIS(Sure Independence Screening)の研究をさらに発展させ、実際のゲノムコホートデータでの遺伝子×遺伝子相互作用ならびに遺伝子×環境相互作用への適用を進めてきた。それらの進捗は当初の研究計画に沿って予定通り実施されている
平成26年度で作成した遺伝子×遺伝子ならびに遺伝子×環境相互作用のための高次元変数選択法ソフトウェアを完成させ、ホームページを作成して公開する。論文出版と学会発表を行う。
すべて 2015 2014 その他
すべて 雑誌論文 (6件) (うち査読あり 6件) 学会発表 (5件) (うち招待講演 1件) 図書 (1件) 備考 (1件)
Pigment Cell Melanoma Res.
巻: 28 ページ: 233-5
10.1111/pcmr.12337.
J Hum Genet.
巻: 60 ページ: 35-40
10.1038/jhg.2014.98.
Am J Hum Genet.
巻: 95 ページ: 294-300
10.1016/j.ajhg.2014.07.013.
Endocr J.
巻: 61 ページ: 967-88
10.1507/endocrj.EJ14-0271
Platelets
巻: - ページ: -
10.3109/09537104.2014.912750
Stat Med.
巻: 33 ページ: 4934-48
10.1002/sim.6264.
http://www.genetix-h.com/~AMERI/