研究課題
本研究ではRNAの機能発現に必要な修飾構造の全体像の解明をめざしている。イノシン化部位の同定に関しては、公開されている約500万のESTデータベースとヒトゲノム配列の比較から絞り込まれたA/G置換部位をA-to-Iエディティング候補部位とし、ICE法を用いたゲノムワイドな解析を行っている。最終的に、約4,000領域の解析を実施し、約2万箇所のイノシン化部位を特定した。解析した領域にはイスラエルのCompugenのグループが計算科学的な手法で予測したイノシン化部位が6,154箇所含まれていたが、このうちイノシンであることが確認できた箇所は3,764箇所(57%)に留まった。残りの4割強の箇所については、EST上で見られるSNPやシーケンスの間違い、あるいは我々が解析した個体では観測されないイノシン化部位であると考えられる。一方で全体の82%に相当する約16,600箇所に関しては完全に新規部位であった。さらに網羅的にイノシン化部位を特定する手法として、ICE法と次世代シーケンサー(Genome analyzer, Solexa)を組み合わせた手法(ICE-Seq)を考案した。なお、次世代シーケンサーによる解析は支援班(豊田先生、藤山先生)との共同研究である。解析対象のRNAをイノシン特異的なシアノエチル化の処理(ICE-)と未処理(ICE+あるいはICE++)で調製し、cDNAを大量シーケンスを行い、全遺伝子に貼り付けた後で、ICE-の条件でA/G置換部位を検出する。イノシン化部位はシアノエチル化後(ICE+あるいはICE++)でイノシンに由来するGのリードが特異的に減少するため、情報処理を行うことでイノシン化部位の検出が可能である。ヒト成人脳由来のポリA+RNAをシアノエチル化の処理と未処理で調製し、mRNA-Seqのプロトコルで約300塩基対のcDNAを合成した。Genome analyzerを用い、75塩基長のペアーエンドで最終的に27レーン分の解析を行っていただいた。10億リード、740億塩基分の配列が得られた。マッピングソフトウェアBWA5.1を使用し、UCSC geneをリファレンス配列として各リードを貼り付けたところ、全体の約6割のリードを貼り付けることができた。結果として、ICE-が160億塩基、ICE+が130億塩基、ICE++(強条件)が140億塩基分のデータが得られた。遺伝子に貼り付けたリードの平均重複度が20×以上のものを解析対象とした。Gのリードの特異的な減少を指標にイノシン化部位を絞り込んだところ、現時点で5,647箇所のイノシン化候補部位を絞り込むことに成功した。実際この中に、我々が先に特定したイノシン化部位が1,285箇所含まれていた。また、コーディング配列内には、235か所の候補部位が見出されたが、実際この中に、既報の19箇所が含まれていることから、ICE-Seqの同定精度の高さが窺える。
すべて 2010 2009 その他
すべて 雑誌論文 (13件) (うち査読あり 13件) 学会発表 (9件) 図書 (3件) 備考 (1件)
Nat Chem Biol. 6
ページ: 277-282
FEBS Lett. 584
ページ: 272-277
Methods in Mol Biol (印刷中(掲載確定))
Nucleic Acids Res. 38
ページ: 1341-1352
Nature 461
ページ: 1144-1148
Nucleic Acids Res. 37
ページ: 6881-6895
Proc.Natl.Acad.Sci.USA. 106
ページ: 15616-15621
ページ: 16209-16214
Biochim Biophys Acta. 1792
ページ: 791-795
J.Biol.Chem. 284
ページ: 20467-20478
Mol Cell. 34
ページ: 760-766
DNA and RNA modification enzymes(Book LANDES)(ed Grosjean, H.)
ページ: 392-405
Dev Cell 17
ページ: 775-787
http://rna.chem.t.u-tokyo.ac.jp/