• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Research-status Report

全ゲノムシークエンスデータ解析による新規配列の網羅的同定と解析

Research Project

Project/Area Number 23790389
Research InstitutionThe Institute of Physical and Chemical Research

Principal Investigator

藤本 明洋  独立行政法人理化学研究所, 情報解析研究チーム, 研究員 (30525853)

Project Period (FY) 2011-04-28 – 2013-03-31
Keywords全ゲノムシークエンス
Research Abstract

本研究計画で、申請者は全ゲノムシークエンスデータを解析することで、ヒト標準ゲノム配列に存在しない新規配列を網羅的に同定する。また、標準ゲノム配列上の位置を解析するほか、新規配列の集団間比較や種間比較を行うことにより、新規配列の特徴を明らかにする。このためには、新規配列同定のための解析手法の確立(改良)が必要である。解析の手順は、シークエンスデータをblastプログラムでマッピングし、ヒトゲノム標準ゲノム配列にマッピングされない配列を集めてde novoアセンブリを行う。その後、構築された新規配列をblastを用いて、類似性が高い生物(標準ゲノム配列以外のヒト、霊長類、細菌など)の同定を行う。申請者等は、日本人ゲノム配列の解析パイプラインを構築し、新規配列検出のための方法論の検討を行った。具体的な検討項目は以下である。(1)先行研究(Fujimoto et al. (2010))では、blastプログラムを用いて標準ゲノム配列にマッピングされる配列を取り除いていたが、blastプログラムは非常に遅く、多数個体の全ゲノムシークエンス解析には不適であると思われた。そこで、より高速なBAW-SWプログラムを用いて標準ゲノム配列にマッピングを行い、結果が大きく異ならないことを確認した。(2)Fujimoto et al. (2010)では、新規配列の詳細な解析は行っていなかったが、タンデムリピートが多く含まれることが分かった。このようなタンデムリピート配列は、そのため、denovoアセンブリの後に、リピート検出プログラム(tandem repeat finder)を用いてリピート配列の検出を行うこととした。この処理により、blastを用いた新規配列の特徴付けに要する計算時間の短縮が可能となる。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

プログラム開発は順調に進んでいる。申請時と比べて、シークエンサーのデータ産出量が増大しており、100人の日本人の全ゲノム配列解析の配列解析が可能となり、より網羅性が高い研究が可能になると期待される。また、我々のアルゴリズムをがんゲノムの配列解析に用いたところ、病原菌のゲノムが正しく検出され、ヒトゲノムへの挿入箇所も正しく同定された。このことは我々のアプローチの正しさを示唆していると考えられる。

Strategy for Future Research Activity

(1)新規配列と標準ゲノム配列にまたがってマッピングされるリードペアを用いて、新規配列の標準ゲノム配列上の位置の推定を行う。ペアエンド法では、一分子の両端からシークエンスされた情報が得られる。したがってペアを形成するリード配列同士は、近傍(実験的に決定されたライブラリサイズの範囲、一般的には500bp以内)に存在すると考えられる。このことを用いると、新規配列の標準ゲノム配列上の位置が推定できる。この際、5ペア以上で示唆されるポイントを新規配列の挿入点の候補とする。(2)新規配列上の遺伝子推定とRT-PCRによる発現確認を行う。遺伝子検出プログラム(GENSCAN)を用いて新規配列上の遺伝子を検出する。検出された遺伝子候補を10種類のヒト組織と10種類の細胞株を用いて発現の有無を検証する。(3)規配列上の多型検出を行う。新規配列上にマッピングされたリード配列を用いてSNPやコピー数変化(CNV)を検出する。SNPをランダムに200個選び、サンガー法でシークエンスを行い、検出精度を検証する。また、新規配列上のSNPの密度を標準ゲノム配列と比較する。(4)成果を論文としてまとめるとともに、データを公開する。

Expenditure Plans for the Next FY Research Funding

実験用の試薬の購入、RNAサンプルの購入、論文投稿費に使用する。

  • Research Products

    (5 results)

All 2012 2011

All Journal Article (2 results) Presentation (3 results)

  • [Journal Article] 次世代シークエンサーを用いた日本人ゲノム解読による遺伝的多様性の包括的解析2012

    • Author(s)
      藤本明洋, 中川英刀, 角田逹彦
    • Journal Title

      最新医学

      Volume: 67 Pages: 132-136

  • [Journal Article] 次世代シークエンサーを用いた日本人ゲノム解読による遺伝的多様性の包括的解析2012

    • Author(s)
      藤本明洋, 中川英刀, 角田逹彦
    • Journal Title

      生体の科学

      Volume: 62 Pages: 523-528

  • [Presentation] 次世代シークエンサーを用いた日本人の全ゲノムシークエンスと遺伝的多様性の包括的解析2011

    • Author(s)
      藤本明洋
    • Organizer
      統計学会
    • Place of Presentation
      福岡県福岡市
    • Year and Date
      2011年9月6日
  • [Presentation] Whole-genome sequencing and comprehensive variant analysis of a Japanese individual using massively parallel sequencing2011

    • Author(s)
      藤本明洋
    • Organizer
      分子生物学会(招待講演)
    • Place of Presentation
      神奈川県横浜市
    • Year and Date
      2011年12月14日
  • [Presentation] Whole genome sequence of a Japanese individual with massively parallel sequencing technology2011

    • Author(s)
      藤本明洋
    • Organizer
      東アジア人類遺伝学会
    • Place of Presentation
      埼玉県大宮市
    • Year and Date
      2011年11月10日

URL: 

Published: 2013-07-10  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi