2011 Fiscal Year Research-status Report
全ゲノムシークエンスデータ解析による新規配列の網羅的同定と解析
Project/Area Number |
23790389
|
Research Institution | The Institute of Physical and Chemical Research |
Principal Investigator |
藤本 明洋 独立行政法人理化学研究所, 情報解析研究チーム, 研究員 (30525853)
|
Project Period (FY) |
2011-04-28 – 2013-03-31
|
Keywords | 全ゲノムシークエンス |
Research Abstract |
本研究計画で、申請者は全ゲノムシークエンスデータを解析することで、ヒト標準ゲノム配列に存在しない新規配列を網羅的に同定する。また、標準ゲノム配列上の位置を解析するほか、新規配列の集団間比較や種間比較を行うことにより、新規配列の特徴を明らかにする。このためには、新規配列同定のための解析手法の確立(改良)が必要である。解析の手順は、シークエンスデータをblastプログラムでマッピングし、ヒトゲノム標準ゲノム配列にマッピングされない配列を集めてde novoアセンブリを行う。その後、構築された新規配列をblastを用いて、類似性が高い生物(標準ゲノム配列以外のヒト、霊長類、細菌など)の同定を行う。申請者等は、日本人ゲノム配列の解析パイプラインを構築し、新規配列検出のための方法論の検討を行った。具体的な検討項目は以下である。(1)先行研究(Fujimoto et al. (2010))では、blastプログラムを用いて標準ゲノム配列にマッピングされる配列を取り除いていたが、blastプログラムは非常に遅く、多数個体の全ゲノムシークエンス解析には不適であると思われた。そこで、より高速なBAW-SWプログラムを用いて標準ゲノム配列にマッピングを行い、結果が大きく異ならないことを確認した。(2)Fujimoto et al. (2010)では、新規配列の詳細な解析は行っていなかったが、タンデムリピートが多く含まれることが分かった。このようなタンデムリピート配列は、そのため、denovoアセンブリの後に、リピート検出プログラム(tandem repeat finder)を用いてリピート配列の検出を行うこととした。この処理により、blastを用いた新規配列の特徴付けに要する計算時間の短縮が可能となる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
プログラム開発は順調に進んでいる。申請時と比べて、シークエンサーのデータ産出量が増大しており、100人の日本人の全ゲノム配列解析の配列解析が可能となり、より網羅性が高い研究が可能になると期待される。また、我々のアルゴリズムをがんゲノムの配列解析に用いたところ、病原菌のゲノムが正しく検出され、ヒトゲノムへの挿入箇所も正しく同定された。このことは我々のアプローチの正しさを示唆していると考えられる。
|
Strategy for Future Research Activity |
(1)新規配列と標準ゲノム配列にまたがってマッピングされるリードペアを用いて、新規配列の標準ゲノム配列上の位置の推定を行う。ペアエンド法では、一分子の両端からシークエンスされた情報が得られる。したがってペアを形成するリード配列同士は、近傍(実験的に決定されたライブラリサイズの範囲、一般的には500bp以内)に存在すると考えられる。このことを用いると、新規配列の標準ゲノム配列上の位置が推定できる。この際、5ペア以上で示唆されるポイントを新規配列の挿入点の候補とする。(2)新規配列上の遺伝子推定とRT-PCRによる発現確認を行う。遺伝子検出プログラム(GENSCAN)を用いて新規配列上の遺伝子を検出する。検出された遺伝子候補を10種類のヒト組織と10種類の細胞株を用いて発現の有無を検証する。(3)規配列上の多型検出を行う。新規配列上にマッピングされたリード配列を用いてSNPやコピー数変化(CNV)を検出する。SNPをランダムに200個選び、サンガー法でシークエンスを行い、検出精度を検証する。また、新規配列上のSNPの密度を標準ゲノム配列と比較する。(4)成果を論文としてまとめるとともに、データを公開する。
|
Expenditure Plans for the Next FY Research Funding |
実験用の試薬の購入、RNAサンプルの購入、論文投稿費に使用する。
|
Research Products
(5 results)