柔軟性・拡張性に富むユーザ志向型のゲノム情報解析の環境をUNIX上で構築するひとつの方法は、ゲノム情報解析のためのツール群をディスク上のコマンドファイルとして作成することである。しかし、このような方法で構築された環境では、柔軟性を実現するために解析ツール・コマンドの再利用性・汎用性を高めると、プロセス間通信によるツール・プロセス間のデータの受渡しが増加するために、解析の処理速度が大幅に低下する問題がある。さらに、ネットワークへの対応も困難である。本研究で開発を行ったgshでは、これらの問題を解決するためにクライアント/サーバ・モデルを採用し、データの受渡しの多い解析ツールをひとつのサーバプロセスのサービスとして提供するようにした。さらに、サーバ上にUNIX型のファイルシステムを構築し、解析にもちいるデータの管理も同時にできるようにした。サーバ上に実現した、標準入出力機能、リダイレクション機能、パイプライン機能、ファイルシステムを利用すれば、サーバがサポートする解析ツール間のデータの受渡しを同一のプロセス内で行なうことができる。したがって、単純な解析ツールを組み合わせて複雑な解析を行なう場合でも、プロセス間通信により繰り返しデータの受渡しを行なうことがないので、高速な処理が可能である。このような方法は確かに処理速度を落さず柔軟性の高い解析環境を実現するのに適している。しかし、反面、実現可能な解析処理がサーバがサポートするツールにより制限されてしまうために、解析環境の拡張性が損なわれる欠点がある。この問題点を解決するために、gshではサーバに新しい解析ツールを追加したりサーバから不必要なツールを削除する作業をユーザが簡単に行なえる機能を用意した。この機能を利用することにより、ユーザは高速で柔軟性の高い解析環境を自由に拡張することができる。
|