増え続けるゲノム・プロテオームデータに対応するために、公共データベースから必要なデータをダウンロードして管理するパイプラインを構築した。また、大規模なオーソログクラスタリングに対応させるために、クラスタリングプログラムを改良して、メモリの使用効率を高めるとともに、ドメインが分断しすぎないようにした。さらに、クラスタリング結果をどのように表現するかというデータモデルを策定し、RDFでデータベースを構築して、様々なアプリケーションから利用可能にした。SPARQLによる論理的なクエリ作成も行えるようにするとともに、クエリの結果を可視化するプログラムを開発した。
|