研究課題/領域番号 |
26860228
|
研究機関 | 独立行政法人理化学研究所 |
研究代表者 |
鎌谷 洋一郎 独立行政法人理化学研究所, 統合生命医科学研究センター, 副チームリーダー (00720880)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 遺伝統計学 / 全ゲノム解析 / エピスタシス / 機械学習 |
研究実績の概要 |
理化学研究所統合生命医科学研究センター基盤技術開発研究グループにおいてIllumina OmniシリーズのSNP arrayによって生成された171,979人、884,948 SNPsからなる全ゲノムSNP遺伝型データについて、同センター統計解析研究チームにおいてQuality Controlを実行して作成された高精度全ゲノムSNP遺伝型データを受領し、解析を開始した。 このレベルのデータを取り扱うにあたって、購入した計算機の持つメモリの範囲で解析が可能となるようにデータを読み込むプログラムの作成を行った。その際、LAPACKやEIGENなどの公的に利用可能なライブラリにおいて使用可能なデータとなるように工夫している。PLS回帰、CART、RandomForestなどを今後実行する予定である。 具体的に交互作用を示している遺伝子セットそのものの検出をするための解析を計画する傍ら、複雑遺伝性疾患の遺伝的モデルとして以前から広く用いられていて、近年ゲノムワイドデータにも応用されている分散成分モデル(Variance component model)を応用し、相加的作用項のみならず交互作用を表す項を加え、それぞれの分散成分を推定することで、全ゲノムにおける全体的な交互作用の大きさを推定したり、またこの交互作用項を工夫することで様々なタイプの交互作用効果のうちどのようなタイプの交互作用の影響が大きいかを検討する解析に取り組んでいる。このモデル推定には大サンプルが必要であるところ、BBJデータはそれに適したサンプルであると考えられる。これは研究計画に述べた、データ構造全体についての様々な解析法を検討した結果、行っているものである。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
遺伝型データのクオリティコントロール(精度管理)確定に時間がかかり、データ受領並びに解析の開始が遅れた。その上でプログラム作成に時間を取られている。 その他、私の役職が徐々に変化したため、本務の作業が非常に多くなってしまっている。このことは反省し、次年度は本研究テーマにより時間を割けるように努力する予定である。
|
今後の研究の推進方策 |
エピスタシスの効果全体の寄与度の推定と、実際にエピスタシス効果を起こす遺伝子セットの同定に向けて解析を進めていく予定である。
|
次年度使用額が生じた理由 |
本務の作業が多くなったため、本科研費事業に関連した学会に行くことができず、旅費を使用しなかった。
|
次年度使用額の使用計画 |
本科研費を使用した業績発表のための学会出張費などに使用する。
|