研究概要 |
細胞性粘菌の非転写領域から各発現時期に特徴的な配列を抽出するために音声認識技術(スポッティング法)を適用し,以下の技術を開発した. 【1】既に開発済みの「スポッティング法を用いた非転写領域の発現規則発見プログラム」をベースに,これを特徴配列(規則)のパターン類似度と位置類似度の重み付けを調整できるように改良した.また,配列長Lを変化させた時に,特徴配列がLの変化とともにどのように継承されているかを表示,解析できるプログラムを開発した. 【2】【1】で改良を行ったプログラムをDictyostelium discoideumの4つの発現期(a, v, c, s)の非転写領域に適用し,各発現期に特徴的な配列を抽出する実験を開始した(この特徴配列が,その発現期に固有な遺伝子調節配列と考えられる).特に発現期vにおいて80%以上の発現比率を有するコンティグデータに本システムを適用することにより,高い精度で発現期vに対する遺伝子調節配列を抽出できると考えられる. 【3】さらに,Z-scoreを適用することにより,統計的に優位な配列を発見するアルゴリズムを提案し,これを上記開発プログラムに組み込んだ.この統計的手法により特徴配列を選別したところ,attaatat, attacaaa, atttagtaがvステージにおいて,ttattcta, atgtgtta, aaaattga,がaステージにおいて,attgtaaa, accatcaa, aataattgがsステージにおいて,そして,atagtttt, ttaataat, gaataataがcステージにおいて特徴的に優位な配列であることがわかた. さらに,上記アルゴリズムの高速計算のためにPCクラスタ(複数のパソコンをネットワーク接続した並列計算システム)を用いた並列アルゴリズムを提案した.これにより,計算時間の高速化に関してほぼスケーラブルな台数効果が期待できる.
|