今年度は、1)遺伝子モジュール抽出法の高速化、および2)既存のツール・データベースを用いたオンデマンド解析インタフェースの実装を行った。 【1)遺伝子モジュール抽出法の高速化】 前年度は、ノイズ(欠損値など)を含む重要な遺伝子の取りこぼしを軽減するため、疑似クリーク列挙アルゴリズムに基づく新しいモジュール抽出法を開発した。しかし、ノイズ許容により探索空間が極めて膨大になることから計算の高速化が大きな課題となっていた。この問題を解決するため、以前代表者らが開発した「飽和集合マイニングに基づくモジュール抽出法」を用いて、まずノイズを含まないモジュール(以下コアと呼ぶ)を抽出し、それらに対して疑似クリーク列挙アルゴリズムを適用する方法を考案した。さらに、コアを抽出する過程で、複数クラスをまたぐ(すなわち異なるクラスラベルをもつ遺伝子で構成される)不要かつ膨大なモジュールに対して効率的に枝刈りを行う方法を開発した。これらの拡張により、重要遺伝子の取りこぼしを軽減して生物学的に有用なモジュールを抽出するという当初の目的を果たしつつ、探索空間と計算時間の両方を劇的に縮減することに成功した。上記の拡張法を、前年度に収集した心理状態に係わる遺伝子発現データに適用し、モジュールデータベースの再構築を行った。 【2)オンデマンド解析インタフェースの実装】 外部の公的に利用可能なツールやデータベースへの接続インタフェースを構築した。これにより、モジュールに含まれる遺伝子の詳細機能に加え、他の遺伝子との配列相同性、疾患関連および関連文献を瞬時に調査できるようになった。
|