計画研究
ヒメツリガネゴケの分離集団のIlluminaによるペアエンドシーケンスを参照ゲノム配列にマッピングしSNPを検出した情報から、信頼性の高いSNPを選択し、scaffoldと比較することにより、reference scaffoldの誤りを検出できることができた。市販のRNAseqライブラリの調製キットのプロトコルはリファレンスゲノムが明らかになっているモデル生物の発現定量解析を想定して作製されている。しかし、本領域では非モデル生物を対象としたde novo assemblyを行うアプリケーション多い。このため、Illumina TruSeq RNAseq library preparation kitの標準プロトコルを改変した。主な改変点は以下のとおり。1)RNA-seq de novo assemblyに有利な長めのインサート長を実現するためにRNA断片化条件を最適化した。2)PCRバイアスを最小限にするためにPCRサイクル数を標準プロトコルより少なめに設定した。その他、コスト削減のための工夫を行った。トランスクリプトーム de novo assemblyから転写産物量を推定するため、Trinity-bowtie-RSEMの解析フローによって転写産物量を推定できるようになった。特にTrinityのGraphFromFastaステップのメモリ使用量を抑制し、大量の入力データでも現実的なメモリ使用量でアセンブリーを行う事が可能になった。比較トランスクリプトーム解析を行うための新規正規化法TbTの開発を行った。最近示された実際のデータの特徴(発現レベルが低いほどバラツキが大きい)をできるだけ模倣したシミュレーションデータの作成を行い、解析を行ったどのシミュレーション条件においても、これまでに提案された二群間比較解析手法中で採用されている正規化法以上の性能を示すことを確認した。
2: おおむね順調に進展している
各視点において、順調な研究の進展があった。
[1] scaffoldの誤り点で切断し再度遺伝的距離にもとづいて再配列することにより、染色体スケールのアセンブリーを作成する。誤り判定の適切な閾値設定が課題である。[2] Strand-Specific RNA-seqライブラリ作製について試験ライブラリーを作成しているが、そのシークエンス結果の解析検証を行う。[3] アセンブリーの品質を他の方法と比較評価することと、transcriptとして推定された配列がコードしている産物が何であるかのアノテーションする方法を確立する。[4] 今回開発した正規化法は、「biological replicatesデータを前提とした二群間比較用」であるが、この領域では多群間比較や複製実験データを得ることが難しいサンプルも存在するため、これらのデータにも適応可能な正規化法の開発を行う。
すべて 2012 2011
すべて 雑誌論文 (6件) (うち査読あり 6件) 学会発表 (3件) (うち招待講演 2件)
Algorithms Mol. Biol.
巻: 7 ページ: 5
10.1186/1748-7188-7-5
Science
巻: 332 ページ: 960-963
10.1126/science.1203810
BMC Bioinformatics
巻: 12 ページ: 227
10.1186/1471-2105-12-227
Cellular and Molecular Life Sciences
巻: 68 ページ: 1297
10.1007/s00018-011-0645-2
Plant Cell
巻: 23 ページ: 2924-2938
10.1105/tpc.111.088005
Molecular Biology and Evolution
巻: 28 ページ: 3113-3126
10.1093/molbev/msr140