計画研究
長距離のscaffolding をする10 kb 程度までのインサートメイトペアライブラリを実現した。これを用いた5種のゲノム解析においては、それぞれscaffold N50 1 Mb 以上 の高品質なアセンブリ結果を得た。PacBioライブラリについてもインサートサイズを大きくする事が重要になったが、自動核酸分離回収装置を利用した技術開発によって、インサート長10kb以上のシーケンスライブラリを安定して作製することができるようになり、安定して平均サブリード長6-8kbのPacBioシーケンシングが可能となった。PacBioリードデータを用いたアセンブリについて、笠原らが開発したspraiを用いてPacBio リードを補正する方法により、バクテリアではほぼ染色体サイズのアセンブリが得られるようになった。真核生物のコモウセンゴケゲノム(0.3 Gb)においてもContig N50 80 kbに至っている。また、PacBioを用いたゲノム解読では、必要なゲノムDNA量が10 μg以上と多いという問題があったが、全ゲノム増幅を行うことにより10 ng程度で解読する手法を実現した。大腸菌ゲノムを使った実験では、10 ngのゲノムを出発材料として、ゲノムアセンブリに成功した。RNA-seqのde novoアセンブルで得られたコンティグから遺伝子モデルを構築しアノテーションを行なうパイプラインを構築した。さらにそのアノテーション情報をwebインターフェイスで閲覧・検索可能なサーバを構築するフレームワークを開発した。4種のRNA-seqデータに適用し、利用されている。このフレームワークは生物種を問わず利用可能であるが、昆虫向けにはFlyBaseとリンクするモジュールを組み込み、モデル昆虫ショウジョウバエの情報を有効活用できるようにした。頑健な比較トランスクリプトーム解析パイプラインを実装したRパッケージTCC (ver. 1.2.0)をBioconductor上で公開した。また、解析可能な実験デザインの拡張(3, 4群間用まで対応)を行った。
2: おおむね順調に進展している
多くの生物でMb級のscaffoldが得られ、Contig長としても100kbに迫っているのは画期的であり、さらに、多種のデータを効率的に閲覧するシステムを構築し、新規の発現量比較法を開発しているので、非モデル生物のゲノム解析の方法開発としてはおおむね順調である。
微小な生物や微小組織しか得られない場合にも解析出来る技術開発をさらに進める。
すべて 2014 2013 その他
すべて 雑誌論文 (7件) (うち査読あり 7件、 オープンアクセス 6件、 謝辞記載あり 3件) 学会発表 (5件) 備考 (2件)
PLoS genetics
巻: 10 ページ: e1004223
10.1371/journal.pgen.1004223
BMC Genomics
巻: 15 ページ: 183
10.1186/1471-2164-15-183
BMC Bioinformatics
巻: 14 ページ: 219
doi:10.1186/1471-2105-14-219
Genome Announcements
巻: 1 ページ: e00441-13
10.1128/genomeA.00441-13
Plant Cell Physiol
巻: 54 ページ: 433-447
10.1093/pcp/pct022
Nature genetics
巻: 45 ページ: 701–706
10.1038/ng.2615
PLOS ONE
巻: 8 ページ: e76678
10.1371/journal.pone.0076678
http://koke.asrc.kanazawa-u.ac.jp/HOWTO/
http://www.iu.a.u-tokyo.ac.jp/~kadota/r_seq.html