本研究では、ヒト等の様々な生物種をその対象として、ゲノムを1本の線ではなく、情報科学におけるグラフ構造を用いて、分岐やループなど様々なパターンを表現するグラフゲノムというデータ構造のもと、その構築に関連するアルゴリズム開発を、可視化を通して行うことを目指している。 今年度は、以前より開発を続けているグラフゲノムブラウザ及び、その関連ツールの開発を継続している。具体的には、利用者の要望に沿って機能改善を行ったほか、新たに両親と子のゲノムであるトリオデータに対するグラフゲノム可視化を行う解析パイプラインを整備した。それに加え、リニアゲノムにおける断片配列アラインメントに対する多機能で高速な可視化モジュールを実装した。このモジュールを用いることで、ユーザーのコンピューター上で動作するゲノムブラウザのフロントエンド部分から、時間のかかる断片配列アラインメントを描画する部分の実装を分離することができるようになる。これにより、スーパーコンピューターセンターのようなマルチノードのクラスター計算機環境が利用可能な場合に、複数サンプルのリードアラインメント可視化をユーザーのコンピューター上で行う時、それぞれのトラックの描画をクラスター計算機上で並列実行できるようになることで、スケーラブルに可視化できるようになる。この可視化モジュールについては、既存のゲノムブラウザと連携して動作するような実装を行った。
|