2015 Fiscal Year Research-status Report
バイオバンク・ジャパンサンプルに対する全ゲノムデータの構造的解析
Project/Area Number |
26860228
|
Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
鎌谷 洋一郎 国立研究開発法人理化学研究所, 統合生命医科学研究センター, チームリーダー (00720880)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 遺伝統計学 / 全ゲノム解析 / エピスタシス / 機械学習 |
Outline of Annual Research Achievements |
理化学研究所統合生命医科学研究センター基盤技術開発グループにおいてIllumina OmniシリーズのSNP arrayによって生成された171,979人、884,948 SNPsからなる全ゲノムSNP遺伝型データについて、同センター統計解析研究チームにおいてQuality Controlを実行して作成された高精度全ゲノムSNP遺伝型データを受領し、解析を開始した。 本年度は機械学習法の一つで、最も優れた手法の一つとされるRandomForest法を用いてゲノムデータの解析を行った。この手法を用いることで、ゲノム上の多数の遺伝的変異を同時に用いた疾患発症の予測精度を検討することができるが、膨大な記憶容量と計算量が必要であり、このデータに最適なプログラムを用いる必要があったため、まずその検討を行った。様々な解析アルゴリズムを検討したところ、我々の持つ膨大なデータ量に対して解析可能であったRangerライブラリを選択し、実装した。 実際の解析にあたっては、まずチューニングを行い解析パラメータの最適化を検討した。その後、すべての遺伝的変異が加法的効果を持つとの仮定のもとに、一次結果を得た。現在は、本研究課題の目標でもある、非加法的効果(エピスタシスなど、すなわち複数の遺伝的変異がその組み合わせによってそれぞれ単独とは別の効果を持ちうるとするもの)を仮定した解析に取り組んでいる。 また、Variance Component Modelを用いた非加法的効果の大きさの推定については、プログラムの実装に引き続き取り組んでいる。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
私自身が管理職となり書類仕事が増えたことにより大きな遅れが生じているが、可能な限りの範囲で解析を進めている。
|
Strategy for Future Research Activity |
エピスタシスの効果全体の寄与度の推定、並びに実際にエピスタシス効果を起こす遺伝子セットの同定に向けて引き続き解析を進める。
|
Causes of Carryover |
本務の作業が多くなったため、使用しなかったものがある。
|
Expenditure Plan for Carryover Budget |
成果が出たところでの発表に関連した旅費として使用する予定である。
|