2007 Fiscal Year Annual Research Report
転写開始点データベースDBTSSの拡張とプロモータ解析
Project/Area Number |
18700286
|
Research Institution | The University of Tokyo |
Principal Investigator |
山下 理宇 The University of Tokyo, 医科学研究所, 特任助教 (10401259)
|
Keywords | 転写制御 / 選択的プロモータ / 転写開始点 / バイオインフォマティックス / データベース / シスエレメント |
Research Abstract |
(1)DBTSSへのデータの追加 発現量とプロモータを組み合わせた解析ができるようにLamb(2005)らによって報告され、Connecitvitymapとして知られているマイクロアレイのデータ454種を入手した。これを用いてある薬剤で誘導されている遺伝子群、及び、そのプロモータ領域を抽出できる機能を付加した。さらに、そのプロモータにおいてTRANSFACの既知転写因子結合部位を予測し、濃縮されている結合部位を推定する機能を追加した。また、大規模シークエンサーSOLEXA由来の配列を導入した。DBTSSは、毎月10万件以上のアクセスがあり、転写制御解析の重要なデータベースとして位置づけられていると考えられる。 (2)terminal oligo-pyrimidine(TOP)配列を持つ遺伝子の網羅的解析 転写開始点は、initiatorとpyrimidine-richな配列のどちらかにおおよそ分かれることを見いだした。後者は、TPOと知られており、饑餓状態や薬剤処理により優先的にリボソームを解離させるという翻訳レベルでの発現制御を受けていることが報告されている。そこで、このTOP配列に着目し、それを持つ遺伝子の網羅的検出を行った結果、ヒトで1645遺伝子に見い出された。さらに、マウスのオーソログ遺伝子にもTOP配列が見つかった239遺伝子に関して実験的な検証を行った。その結果、翻訳制御の程度とmRNAの長さは逆相関の関係(-0.61)にあることがわかった。 (3)大規模シークエンサーから得られた配列によるプロモータの同定と解析 データとして15種類の実験に基づくSOLEXA由来のデータ約3億配列を使用した。得られた配列をゲノムにマッピングし、500bp以内にある転写開始点を一つのプロモータの単位とした結果、75918のプロモータが同定された。このうち、36251プロモータが既知遺伝子8879遺伝子に相当し、一遺伝子当たり約4個の選択的プロモータを定義できたことになった。また、プロモータにCpG islandsがあるプロモータでは、発現頻度が各サンプル間でばらつかないことが示唆された。
|