計画研究
PacBio RS II は一分子計測で平均長1万塩基の長い断片を解読できる装置である。この技術を活用して、本研究では長い挿入削除、逆位、染色体融合等の構造多型を精度よく検出する研究課題に取り組んだ。技術的課題はDNA 配列を解読するため15%程度の短い挿入削除が入ることである。この問題の解決のために2つのアプローチを試した。1つ目はPacBio リード間でエラーを補正するというアプローチである。PacBio リードをゲノムの40倍から100倍の被覆度で収集する必要があるため、バクテリア等の数百万塩基の小さなゲノムサイズを持つ生物種に対して有効であることが知られている。そこで平成26年度は、線虫(ゲノムサイズ120Mb)、およびメダカ(ゲノムサイズ800Mb) 程度まで本アプローチの有効範囲を拡大した。線虫においては contig N50長で約2Mb、メダカにつては約1Mb の精度の高い配列が得られた。しかし高い被覆度でデータを収集することがコスト面で困難な生物種、たとえばヒトや脊椎動物においては、PacBio リードを高々30倍の被覆度で収集することが現実的である。大規模ゲノムを扱う場合に2つ目のアプローチとして、廉価にデータ収集が可能な長さが100塩基程度の短いIllumina リードを使ってエラーを補正することに取り組んできた。平成25度はヒトを対象にした研究を展開し被覆度30倍のデータを収集し解析をすすめた。平成26年度はこれらの結果から構造多型を抽出するアルゴリズムを研究開発した。ゲノム医科学、シーケンシング、情報科学の分野で国際的に活躍する研究者(森下真一、笠原雅弘)が密に連携し、日本人標準ゲノムの作成、minor allele frequency SNPの検出など、これまでは困難と考えられてきた研究課題で成果をあげ、現在1本を投稿中、3本を投稿準備中である。
26年度が最終年度であるため、記入しない。
すべて 2015 2014 その他
すべて 雑誌論文 (3件) (うち査読あり 3件、 オープンアクセス 2件、 謝辞記載あり 3件) 学会発表 (1件) 備考 (1件)
Journal of Bone and Mineral Research
巻: 29 ページ: 992-998
10.1002/jbmr.2091
Neurology
巻: 82 ページ: 1083
Neurology and Clinical Neuroscience
巻: 2 ページ: 1-4
10.1111/ncn3.72
http://www.personal-genome.jp/