研究概要 |
近年,生物種間の系統情報を用いた,配列,制御ネットワーク,相互作用ネットワークなどの比較による知識発見手法が非常に有効であることが,様々な研究事例から明らかとなっている.従って,本研究は,昨年度から,研究対象問題である「正例文字列にマッチし,負例文字列にはマッチしないパターンの探索問題」を,系統樹情報を利用した問題に特化して研究を展開している.本年度は,次の成果を得ることができた. 1.系統情報を活用してなんらかの知識発見を行う場合,参照する系統樹の質やそれを作り出すための計算コストが重要となってくる.そこで,効率のよい系統樹構築方法の研究を行い,計算機実験でその有効性を確認することに成功した.既存手法では長さkのオリゴペプチド20のk乗個すべてを用いて各生物種のプロファイルを構成していたが,本研究の提案手法では使用するオリゴペプチドを1割程度までに減らしても,さらにそれらをランダムに選択したとしても,ほぼ同等の系統樹を構築できることが明らかとなった. 2.シングル・モチーフに比べて,それらを複数個組み合わせた構造(structured)モチーフは,その表現能力に長けている.そこで,構造モチーフの探索アルゴリズムに関する基礎理論の構築を行い,アルゴリズムを構築し,性能評価を理論と実際の両面から行った.さらに,Saccharomyces属の生物種を用いた予備計算機実験を行い,実際に既知の転写因子結合部位が同定可能であることを確認している.今後の課題は,シングル・モチーフや複数の結合モチーフのなかから効率よく最適解を見つけ出す手法の開発である.
|