本研究の目的は、ヒトゲノム上に大量に存在するAlu配列に対して、機能性RNA遺伝子としての進化的制約を明らかにするとともに、その過程で必要となる、クラスタリングや、RNA進化モデル構築などについて、汎用のゲノム解析ツールを作成することである。本年度は、RNA二次構造アルゴリズムを徹底的に使い、与えられたRNA配列からできる限り多種多様な情報を抽出するための基礎技術の開発を行った。まず、前年度に作成した、Raccessを用いた、miRNAとsiRNAのターゲットサイト近傍のアクセシビリティと抑制効果との関係を調べる研究を論文誌に出版した。次に塩基配列の保存性の計算に使われる連続時間マルコフモデルについての研究を行ない、モデルの完全な十分統計量と期待値最大化(Expectation Maximization)アルゴリズムを完全な形で世界で初めて導出した。この完全な十分統計量には、従来の期待塩基置換数(Number of Expected Substitutions)の他に、期待塩基滞在時間率(Expected Fractional Duration)が含まれることを明らかにした。この期待滞在時間率をゲノムスケールで計算したところ、保存性が低いにも関わらず、期待滞在時間率が低い遺伝子上流領域をもつヒト遺伝子には、体の形成に関わる遺伝子が多く含まれることなどが明らかになった。この研究についても論文誌に掲載された。また、二次構造エネルギーのボルツマン分布に基づき、RNA配列の二次構造の熱力学的エントロピー及び平均自由エネルギーを計算するツール(Rentropy)や、RNA配列の塩基が一つまたは二つ変化したときの内部エネルギー及びエントロピーの変化を求めるツール(Rchange)を開発した。これらについても研究は終了し、現在論文誌に投稿中である。
|