研究概要 |
我々が提案している記号カーネルベース法を非転写領域の発現規則推論に適用し,非転写領域,特にプロモータ領域近辺に隠された高次規則の抽出を試みた.具体的には,Dictyostelium discoideum(細胞性粘菌)をターゲットとし,Dictyostelium discoideumの4つの発現期(A, V, C, S)ごとに各非転写領域ライブラリを構築した.このライブラリに対して当初,記号カーネルベース法をそのまま適用し,その比較結果から高次規則を抽出することに着手したが,有意な差異を見出すことができなかった.このため,DPマッチングの技術を取り入れ,候補となる特徴を網羅探索する改良手法を試みた.この結果,特に発現期Sにおいて,他の発現期にはない特徴的な配列を抽出することができた.今後,この配列が生物学的実験手法においても有意な特徴であること示す必要がある.このため,本成果をもとに生物学の研究者と議論を行う予定である. 記号カーネルベース法を試作した進化ハードウェアの上で実行し,本ハードウェアが大規模遺伝規則推論の高速処理に対して有効であることを示した.一方,上述するように記号カーネルベース法だけでは十分な発現規則抽出ができないことが判明し,DPマッチングの高速処理も不可欠であることがわかった.本研究期間では,高速DPマッチング用ハードウェアを試作することはできないため,PCクラスタによる高速化で対処した.32台のPCで約1日で処理を終了できることがわかった.今後は,この並列処理を専用ハードウェア化する必要がある. アルゴリズム改良の検討中に遺伝的アルゴリズムやニューラルネットワークを用いた新たなゲノム規則推論アルゴリズムを提案することができた.本アルゴリズムを蛋白質構造推定やエクソン領域推定といった基本問題に適用し,有効性を示した.今後,これらのアルゴリズムを発現規則抽出問題に適用する応用についても検討する.
|