研究概要 |
本研究では,新技術であるCAGE(Cap Analysis Gene Expression)法によって得られた発現プロファイルに基づくトランスクリプトーム解析手法に関する研究を行った.遺伝子の転写制御・発現調節メカニズムがいかに多様であるとはいえ,転写制御・発現調節メカニズムが類似した遺伝子は存在しており,そのような遺伝子の発現プロファイル間にはなんらかの形で共通するパターンが見られる可能性がある.またセンス-アンチセンス鎖による転写制御をはじめ,発現調節と遺伝子のゲノム上の位置情報は密接な関連があると考えられる.従来の発現量のみに注目した発現プロファイルに対し,CAGEでは発現量に加え正確な転写開始点の情報が得られるため,このデータを用いることで発現プロファイルとゲノム上の位置を関連付けて解析することができるのが利点である. 本年度は,CAGEを用いたゲノム上の発現構造の網羅的類似性探索手法の開発を行った。この手法は,次の2つの段階に分けられる.まず転写開始点間の距離に注目し,ゲノム上でCAGEタグがマッピングされた部分とそうでない部分をランレングス法により符号化する.そして,この符号化された系列に対して接尾辞木(suffix tree)を利用することで,ゲノム上における共通発現パターンを高速に抽出する.提案手法の評価実験として,マウスのCAGEライブラリから得られたデータに適用し,考察を行った.その結果,センス-アンチセンス鎖による転写制御など,ある種の制御機構が影響していると考えられるゲノムの領域での,転写開始点と発現量の間に存在する共通パターンに関する知見を得ることが出来た.
|