研究課題/領域番号 |
26860228
|
研究機関 | 国立研究開発法人理化学研究所 |
研究代表者 |
鎌谷 洋一郎 国立研究開発法人理化学研究所, 統合生命医科学研究センター, チームリーダー (00720880)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 遺伝統計学 / 全ゲノム解析 / エピスタシス / 機械学習 |
研究実績の概要 |
理化学研究所統合生命医科学研究センター基盤技術開発グループにおいてIllumina OmniシリーズのSNP arrayによって生成された171,979人、884,948 SNPsからなる全ゲノムSNP遺伝型データについて、同センター統計解析研究チームにおいてQuality Controlを実行して作成された高精度全ゲノムSNP遺伝型データを受領し、解析を開始した。 本年度は機械学習法の一つで、最も優れた手法の一つとされるRandomForest法を用いてゲノムデータの解析を行った。この手法を用いることで、ゲノム上の多数の遺伝的変異を同時に用いた疾患発症の予測精度を検討することができるが、膨大な記憶容量と計算量が必要であり、このデータに最適なプログラムを用いる必要があったため、まずその検討を行った。様々な解析アルゴリズムを検討したところ、我々の持つ膨大なデータ量に対して解析可能であったRangerライブラリを選択し、実装した。 実際の解析にあたっては、まずチューニングを行い解析パラメータの最適化を検討した。その後、すべての遺伝的変異が加法的効果を持つとの仮定のもとに、一次結果を得た。現在は、本研究課題の目標でもある、非加法的効果(エピスタシスなど、すなわち複数の遺伝的変異がその組み合わせによってそれぞれ単独とは別の効果を持ちうるとするもの)を仮定した解析に取り組んでいる。 また、Variance Component Modelを用いた非加法的効果の大きさの推定については、プログラムの実装に引き続き取り組んでいる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
私自身が管理職となり書類仕事が増えたことにより大きな遅れが生じているが、可能な限りの範囲で解析を進めている。
|
今後の研究の推進方策 |
エピスタシスの効果全体の寄与度の推定、並びに実際にエピスタシス効果を起こす遺伝子セットの同定に向けて引き続き解析を進める。
|
次年度使用額が生じた理由 |
本務の作業が多くなったため、使用しなかったものがある。
|
次年度使用額の使用計画 |
成果が出たところでの発表に関連した旅費として使用する予定である。
|