バイオインフォマティクスにおけるいくつかの予測問題に対して、機械学習的手法によるアプローチは多くの成果を生み出している。生命情報には不確定性が含まれる事が多いため、確率・統計的手法は自然な枠組みといえよう。従って対象とする量の確率分布を計算することになるが、現実の生命情報では当該確率分布を解析的に表示する事は困難、あるいは不可能の場合がままある。この研究の目的はバイオインフォマティクスにおける予測問題をBayes的枠組みから定式化し、予測精度の向上を目指した。 本研究では生物データのうち、次の2項目に注目した: 【A】タンパク質構造予測 【B】遺伝子制御ネットワーク推定 それぞれに対し、以下の2つのアプローチで達成することを目標として研究を進めてきた。 <アプローチ1>確率的ダナミカルシステムとしてのモデル化とその改良 <アプローチ2>Bayes的枠組みでの高精度モンテカルロ法の実装 特に平成20年度では<アプローチ1>に注力をして研究を進めた。 【A】については、現在の基本アルゴリズムを拡張し、ベイジアンモンテカルロHMMを膜タンパク質構造予測に適用した。適用にあたり、ベイジアンモンテカルロHMMに適した「状態」の接続方法(トポロジ)、適切な出力の選択を調査した。これらは初期実験において比較的良好な結果を示すようになっている。現段階では初期実験にて比較的良好な結果が得られており、国内シンポジウムにて報告を行った。さらに平成21年度には国際会議での発表と論文化を予定している。また、モデル構造の改良には一般化HMMを採用した上で、より適したトポロジの探索を試みた。一般化HMMに関する結果は国際会議、国内会議で報告を行った。 【B】にはZipf則を考慮した基本モデルの構築を行った。ここで得られた知見は論文化され、現在投稿中である。
|