研究課題/領域番号 |
20J22439
|
研究機関 | 東京大学 |
研究代表者 |
末竹 裕貴 東京大学, 情報理工学系研究科, 特別研究員(DC1)
|
研究期間 (年度) |
2020-04-24 – 2023-03-31
|
キーワード | バイオインフォマティクス / データ解析 / ワークフロー / ワークフロー実行システム / ワークフロー共有システム / ユーザインタフェース |
研究実績の概要 |
前年度に引き続き本年度では,バイオインフォマティクス(BI)分野における解析手法の効率的な実行や共有についてのシステム実装と調査を行った. 様々な解析ツールの組み合わせからなる解析手法は,ワークフローと呼ばれ,これらのワークフローを Reproducible,Portable,Maintainable,Sharable にすることを目的とした様々なワークフローシステム (例: CommonWorkflowLanguage,Nextflow) や共通定義 (例: GA4GH Cloud Workstream) が開発・提案されている. この背景のもと前年度では,ワークフロー実行の抽象化を目的として,Sapporo システムを開発した.そこで本年度では,Sapporo システムと既存の他のシステムとの相互運用性についての追加実装・評価を行った.具体的には,ELIXIR Europe により開発されているワークフロー実行システム (ELIXIR-WES) との相互運用や,ワークフロー共有システム (例: Dockstore,WorkflowHub) からのワークフローインポート機能を実装した.また,Sapporo システムと国立遺伝学研究所スーパーコンピュータシステムとの連携を実現した. 加えて本年度では,ワークフロー共有システムの管理コストが継続的なワークフロー開発の妨げとなっているという背景のもと,自動的にワークフローの品質管理を行う共有システムである Yevis システムを開発した.Yevis システムにより,様々な研究コミュニティが独自に品質の高いワークフローを共有することが可能となり,今後の研究加速が期待される.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
引き続きコロナ禍が続いているが,オンラインでの学会参加を行い,実際にデータ解析を行っている研究者に対するインタビューや,同様のシステムを開発しているコミュニティとの相互運用性の確認を行うことができため.今後は,実際のサービスとしての提供といった,さらなる研究成果の発表・提供を行う.
|
今後の研究の推進方策 |
前年度と本年度の研究成果により,解析手法であるワークフローの,実行の抽象化と実際の解析手法の収集が完了している.そのため,これらの成果を活用しつつ,解析手法のテスト手法の一般化を試みる.
|
備考 |
それぞれ Sapporo システムと Yevis システムのソースコード・ドキュメントである。
|