2009 Fiscal Year Annual Research Report
Project/Area Number |
19310128
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
HORTON Paul National Institute of Advanced Industrial Science and Technology, 生命情報工学研究センター, 研究チーム長 (00371071)
|
Co-Investigator(Kenkyū-buntansha) |
堀本 勝久 独立行政法人産業技術総合研究所, 生命情報工学研究センター, 研究チーム長 (40238803)
油谷 幸代 独立行政法人産業技術総合研究所, 生命情報工学研究センター, 研究員 (10361627)
|
Keywords | 遺伝子発現 / 次世代シーケンサー / TSS-Seq法 / 転写頻度 / Quality Scores / 配列度数修正 |
Research Abstract |
H20年度までの結果から、マイクロアレイ・データが遺伝子発現の周辺分布モデル構築のデータとして精度が不十分であることを示した。これを受けてH21年度には、より高精度なデータが期待される、次世代シーケンサーによる転写量測定に注目した。この手法では転写されているRNAを抽出し、cDNAに変換してから、シーケンサーにより配列決定を行い、観察される配列の出現頻度を発現量とみなす。 しかし、シーケンサーの配列出力をそのまま用いると、その方法にも精度の問題がある。これはシーケンサーの誤読配列が配列の頻度計算に誤差をもたらすことに起因する。しかし、マイクロアレイと違い、シーケンサーは配列と共に各配列の誤読確率(quality score)も出力する。 H21年度に我々はシーケンサーのquality score出力を利用し、誤読の配列出現頻度への誤差を修正する統計的手法「RECOUNT」を開発した。検証はコンピュータシミュレーションと実際のデータで行い、両方においてRECOUNTによる修正の有効性が認められた。実際のデータとして、TSS-Seq法(CAGEに似た5'Cap法)のマウス胚の転写データなどを利用し、ゲノムにマッピングできる配列の割合を検証に使った。この研究成果は査読を経て、国際学会Genome Informatics Workship(GIW2009)の口頭発表として選抜され、Genome Informatics誌に論文として掲載された。また、RECOUNTのソフトウェアはseq.cbrc.jp/recountにて無料公開した。
|