2017 Fiscal Year Research-status Report
Project/Area Number |
16K16145
|
Research Institution | The University of Tokyo |
Principal Investigator |
笠原 雅弘 東京大学, 大学院新領域創成科学研究科, 講師 (60376605)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 並列分散計算 / ハイパフォーマンスコンピューティング / コンテナ仮想化 / ゲノム解析 |
Outline of Annual Research Achievements |
再現性のあるワークフローを実現するために、HPCクラスター上で動作させるコンテナシステムについて開発を行った。当初は Docker の利用を想定していたがアカデミア向けのスーパーコンピューターではセキュリティ上の懸念やメンテナンスのコストが高いこともあり、ゲノム解析向けのスーパーコンピューターでは Dockerは利用出来ないことが多い。また、Docker はゲノム解析向けのワークフロー実行に対しては composability が極めて低く使い勝手が悪かった。これらの問題を解決する新しいタイプのコンテナシステムの設計・実装を行った。新システムでは、コンテナ内のプロセスからホスト上の実行バイナリや他コンテナ上の実行バイナリをシームレスに実行できる仕組みを導入し、ゲノム解析パイプラインを開発する際に重要となる composability の高さを実現した。また、これによりユーザーのパイプライン開発時間を短縮した。 また、HPCクラスター上で便利に利用することができるワークフローエンジン TCE を昨年度に引き続いて改良した。 商用クラウドのAmazon EC2 を中小の研究室でゲノム解析に利用する際にはブラウザからの操作を用いるのが推奨される方法であったが、仮想マシンやVPC、スナップショットや DNS 情報を管理するコマンドラインツールを作成し、中小規模の研究室での主な利用シナリオにおいて、ユーザーが短期間に学習でき、短時間で必要な計算機資源の構築を行えるシステムを作った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
おおむね計画通りに進んでいると言える。特に本研究を進めるうえでは「さまざまな研究グループが作成したツール群をお互いに干渉することなく、非常に少ない手間で統合する」ことをユーザーができるようにする必要があるが、初期設定も含めてユーザーランドの権限のみで動作する composable なコンテナシステムなどをはじめとして当初の計画には無かった便利なアイディアをいくつか実装しておりシステムソフトウェアの実装に関しては進捗は期待以上であると言える。ドキュメントやチュートリアル・コミュニティーの整備や講習会の開催についてはやや送れているため、総合的にはおおむね計画通りとした。
|
Strategy for Future Research Activity |
引き続いて Tiny Cloud Engine や Local Package Manager, Tiny Amazon Wrapper んだおのシステムソフトウェア開発を続け、ユーザーが短い学習時間で短期間にゲノム解析パイプラインを作成できるシステムを洗練させていく。ゲノム解析で使用する解析パイプラインをなるべく数多くシステム上に実装して自分たちのグループで使用することで問題点の洗い出しと改良に努める。また、大規模ゲノム解析計算を行っている外のグループとの協業を進め、安定性の強化を急ぐ。整備が遅れているドキュメントやチュートリアルを整備し、新規ユーザーの獲得に努めていく。また、メーリングリストや Wiki などを整備し、講習会を開催することでユーザーコミュニティの形成に努めていく。
|
Causes of Carryover |
直接経費の3%程度の残額は十分少額であり、通常の研究過程で生じる発生費用のゆらぎで説明でき、基金化の趣旨に沿った運用の結果である。
|
Research Products
(2 results)