• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実施状況報告書

バイオバンク・ジャパンサンプルに対する全ゲノムデータの構造的解析

研究課題

研究課題/領域番号 26860228
研究機関独立行政法人理化学研究所

研究代表者

鎌谷 洋一郎  独立行政法人理化学研究所, 統合生命医科学研究センター, 副チームリーダー (00720880)

研究期間 (年度) 2014-04-01 – 2017-03-31
キーワード遺伝統計学 / 全ゲノム解析 / エピスタシス / 機械学習
研究実績の概要

理化学研究所統合生命医科学研究センター基盤技術開発研究グループにおいてIllumina OmniシリーズのSNP arrayによって生成された171,979人、884,948 SNPsからなる全ゲノムSNP遺伝型データについて、同センター統計解析研究チームにおいてQuality Controlを実行して作成された高精度全ゲノムSNP遺伝型データを受領し、解析を開始した。
このレベルのデータを取り扱うにあたって、購入した計算機の持つメモリの範囲で解析が可能となるようにデータを読み込むプログラムの作成を行った。その際、LAPACKやEIGENなどの公的に利用可能なライブラリにおいて使用可能なデータとなるように工夫している。PLS回帰、CART、RandomForestなどを今後実行する予定である。
具体的に交互作用を示している遺伝子セットそのものの検出をするための解析を計画する傍ら、複雑遺伝性疾患の遺伝的モデルとして以前から広く用いられていて、近年ゲノムワイドデータにも応用されている分散成分モデル(Variance component model)を応用し、相加的作用項のみならず交互作用を表す項を加え、それぞれの分散成分を推定することで、全ゲノムにおける全体的な交互作用の大きさを推定したり、またこの交互作用項を工夫することで様々なタイプの交互作用効果のうちどのようなタイプの交互作用の影響が大きいかを検討する解析に取り組んでいる。このモデル推定には大サンプルが必要であるところ、BBJデータはそれに適したサンプルであると考えられる。これは研究計画に述べた、データ構造全体についての様々な解析法を検討した結果、行っているものである。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

遺伝型データのクオリティコントロール(精度管理)確定に時間がかかり、データ受領並びに解析の開始が遅れた。その上でプログラム作成に時間を取られている。
その他、私の役職が徐々に変化したため、本務の作業が非常に多くなってしまっている。このことは反省し、次年度は本研究テーマにより時間を割けるように努力する予定である。

今後の研究の推進方策

エピスタシスの効果全体の寄与度の推定と、実際にエピスタシス効果を起こす遺伝子セットの同定に向けて解析を進めていく予定である。

次年度使用額が生じた理由

本務の作業が多くなったため、本科研費事業に関連した学会に行くことができず、旅費を使用しなかった。

次年度使用額の使用計画

本科研費を使用した業績発表のための学会出張費などに使用する。

  • 研究成果

    (2件)

すべて 2015 2014

すべて 学会発表 (2件) (うち招待講演 2件)

  • [学会発表] Statistical analyses used for gene mapping of human diseases2015

    • 著者名/発表者名
      鎌谷 洋一郎
    • 学会等名
      Tokyo Workshop on Statistically Sound Data Mining
    • 発表場所
      産業技術総合研究所 臨海副都心センター/東京都江東区
    • 年月日
      2015-02-16 – 2015-02-16
    • 招待講演
  • [学会発表] missing heritabilityと、遺伝率推定における仮定について2014

    • 著者名/発表者名
      鎌谷 洋一郎
    • 学会等名
      生命医薬情報学連合大会
    • 発表場所
      仙台国際センター/仙台市
    • 年月日
      2014-10-02 – 2014-10-02
    • 招待講演

URL: 

公開日: 2016-06-01  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi