研究概要 |
ゲノム情報解析の分野においてホモロジーサーチが最も重要なアプリケーションの一つであることは言うまでもなく、より高速なホモロジーサーチシステムを開発することが、遺伝子/タンパク質配列データベースの容量が急激に増加している今日、益々重要な研究課題となっている。そこで、大阪大学遺伝情報実験施設で学内の遺伝子情報解析をサポートするため平成6年3月に導入した30台規模のワークステーションを利用した並列処理によるホモロジーサーチの高速化をはかる研究開発を行なった。 高速化の対象として主に次の2つの理由からfastaを選択した。1)fastaはblastよりサーチの感度は高いがその分計算時間が多くかかる。本施設で最も速いIRIS ChallengeLで、長さ500残基のアミノ酸配列のサーチ(ktup1,データベースpir rel.39)で約7分かかる。2)fastaで得られるスコア値は比較された配列間で決まるので、データベースを分割し別々にfastaを実行し得られた結果を集めるスコアの大きい順にソ-トした結果は、分割前のデータベースで実行したfastaの結果と同じとなる。 本研究で開発した並列処理システムは次の2つの部分から成る。split:各ワークステーションの能力に応じて、データベースを分割し各ワークステーションのローカルディスクにコピーする。pfasta:各ワークステーションに担当するデータベース部分に対するfastaの実行を命じ、終了を待って各々の結果を集め編集し結果を出力する。pfastaはIRIS ChallengeL1台(3CPU)、SUN4/1000 2台(8CPU),SUN4/10 2台、SUN4/LX 10台の、計15台のワークステーション23CPUに実装し,本施設で最も高速な計算機(Challenge L)の約7倍の性能向上を得ている。
|