研究概要 |
本研究は,遺伝子の相互作用を明らかにするために,破壊や過剰発現による実験結果を集めた遺伝子発現プロファイルデータから,そこに内在する相互作用を表現するための規則をユーザとの対話の中で発見するためのシステムを開発することを目的とする.我々の研究グループでは,重み付きネットワークモデルを導入し,発現プロファイルデータから遺伝子間の力関係を辺の重みとして取り出すアルゴリズムを設計し,予備実験を行ってきた.このネットワークを効率よく可視化するための方法論を確立し,それを実装することが目的である. 本年は,グラフィカルモデリングと呼ばれる統計的手法の中で用いられている,共分散選択の技法を応用したシステムを構築し,実データに対して適用を行った.また,遺伝子発現プロファイルデータのみならず,遺伝子の配列情報を合わせてネットワークの同定をより高精度に行うことを目指して,配列データからそこに内在する共通なパターンを抽出する問題について,特に高機能化と高速化に力点をおいて研究を展開した.その結果,部分文字列パターンおよびエピソードパターンに関して,実用的な時間で最も分類精度の高いパターンを見つけだすアルゴリズムの開発に成功した.また,その中で頻繁に用いられる部分に特化したデータ構造を開発し,これらを機械発見システムBONSAIの中に組み込んだ.このことにより,これまでの部分文字列パターンのみを用いた表現方法よりも簡潔でより分類精度のよい決定木が抽出できることを確認した.
|