研究課題
本研究は、(1)ヒト集団ゲノムデータを用いて、解析困難な領域の特徴を明らかにする。また、(2)それらの領域のゲノム配列を読み取り長の長い第3世代シークエンサーを用いて決定することにより、解析困難領域の遺伝的多様性を解明することを目的とする。進捗は以下である。(1) 解析困難な領域の特徴日本人ゲノムを解析し、SNV(一塩基多様性)とindel(挿入欠失)を検出した。また、検出エラーを除くために複数のフィルターを実施した。さらに、全ゲノムのシークエンス深度を全サンプルについてカウントした。これらのデータを用いて、解析困難領域の検出を進めている。(2) 第3世代シークエンサーのエラーの補正法の開発第3世代のシークエンサーの利点は、読み取り長が長いことである。しかし、シークエンスエラー率が高いため、解析が容易ではない。そこで、申請者等は、第3世代シークエンサーのエラー補正を目的として、解析アルゴリズムの開発を行った。短いシード配列を複数用いることでアラインメントの感度を上げることができると考え、短い(6bp)のシード配列を10bp間隔で取得して第2世代シークエンサーのリード配列をマッピングするプログラムを開発した。また、Smith-Watermanアラインメントにおける最適なパラメーターを探索した。この手法を用いて、エラーの補正を行い、その結果をサンガーシークエンス法等を用いて検証することを予定している。
2: おおむね順調に進展している
初年度はおおむね順調であった。全ゲノム配列の解析などが終了し、2年目以降の研究を行うための準備が整ったと考えている。ただ、第3世代シークエンサーのエラー率補正法については、まだ検証と改良が必要であると考えており、2年目以降の課題である。
本年は、初年度の結果を用いて、解析困難領域の定義を行うと共に、第3世代シークエンサーのデータ解析を行う。本計画では中心的な段階になると考えられる。
すべて 2015 2014 その他
すべて 雑誌論文 (11件) (うち国際共著 1件、 査読あり 4件、 オープンアクセス 1件) 学会発表 (3件) (うち招待講演 1件) 備考 (1件)
Oncogene
巻: 34 ページ: 5943-5950
doi: 10.1038/onc.2015.90.
Nat Comms
巻: 6 ページ: 6120
doi:10.1038/ncomms7120
PLoS One
巻: 9 ページ: e114263
DOI: 10.1371/journal.pone.0114263
BMC Med Ethics
巻: 15 ページ: 33
doi:10.1186/1472-6939-15-33
Medical Science Digest
巻: 11月号 ページ: -
血管医学
巻: 9月号 ページ: -
医学のあゆみ
巻: 6月7日号 ページ: -
巻: 5月3日号 ページ: -
巻: 4月26日号 ページ: -
巻: 3月22日号 ページ: -
肝胆膵
巻: 2014年3月号 ページ: -
http://www.riken.jp/pr/press/2015/20150130_3/