研究概要 |
CAGE (Cap Analysis Gene Expression)法によって得られた発現プロファイルに基づくトランスクリプトーム解析手法に関する研究を行った.遺伝子の転写制御・発現調節メカニズムがいかに多様であるとはいえ,転写制御・発現調節メカニズムが類似した遺伝子は存在しており,そのような遺伝子の発現プロファイル間にはなんらかの形で共通するパターンが見られる可能性がある.従来の発現量のみに注目した発現プロファイルに対し,CAGEでは発現量に加え正確な転写開始点の情報が得られるため,このデータを用いることで発現プロファイルとゲノム上の位置を関連付けて解析することができるのが利点である.本研究では,ゲノム上での位置と遺伝子の発現量の示すパターンの類似性を網羅的に探索する手法や,さらにこれを応用し,最尤推定アルゴリズムによって各遺伝子の組織特異的な選択的スプライシングを解析する手法を開発した. 現在,次世代シークエンサーと呼ばれる高速な配列読み取り技術によって,ゲノム配列や全トランスクリプトームを配列断片として大量に読み取る方法が様々な生物学分野に浸透しており,従来を大幅に上回るペースでデータを産み出している.その膨大なデータはNCBIのShort Read Archive (SRA)やEBIのEuropean Nucleotide Archive (ENA)にアーカイブされつっあり,本研究による「位置」と「量」を同時に解析する方法は,これらのデータを二次解析するための方法として有意義な成果であると考えられる.
|