研究課題/領域番号 |
19K11895
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60050:ソフトウェア関連
|
研究機関 | 国立情報学研究所 (2021-2023) 群馬大学 (2019-2020) |
研究代表者 |
横山 重俊 国立情報学研究所, オープンサイエンス基盤研究センター, 特任研究員 (10600968)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
2021年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2020年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2019年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
|
キーワード | 研究再現性 / データ駆動型研究 / ゲノム解析 / 実験数学 / クラウドコンピューティング / Jupyter Notebook / クラウド / 計算科学 / データ科学 / 再現性 |
研究開始時の研究の概要 |
科学論文の再現性は長年の課題である。本研究では、データ駆動型研究実験環境の流通を促進するデータビリティプラットフォームの普及を目指す。具体的には、ICT基盤上に構築された実験環境の再現性をコンテナ技術を用いたオーバーレイクラウド方式の仮想クラウド技術と実行可能な構築手順書構成技術(Literate Computing for Infrastructure)を組み合わせたデータビリティプラットフォームを導入することでデータ駆動型研究実験環境の流通性を飛躍的に高める。さらに複数の実験環境を連携させる仕組みを導入することで、複数分野に跨るデータ駆動型研究の推進やデータ駆動型研究人材の育成に貢献する。
|
研究実績の概要 |
本研究では、ICT基盤上に構築された実験環境の再現性をコンテナ技術によるオーバーレイクラウド方式の仮想クラウド技術と実行可能な構築手順書構成技術(Literate Computing for Infrastructure)を組み合わせることで、データ駆動型研究実験環境の流通性を飛躍的に高めることを目指す。2019年度には本研究の基本構成要素であるControl DataとControlled EnvironmentからなるMicro-abilityのプロトタイプを実現した。Control DataとしてはLiterate Computing for Infrastructureの研究成果であるJupyter Notebookによる実行可能構築手順書を用いる。これはインフラ構築のための実行スクリプトと構築手順同時に記述するだけではなく、実行結果の保存も可能としている。Controlled Environmentとしては各種クラウド上に跨った仮想クラウドを動的に構築できるコンテナ技術を利用したOverlay Cloudアーキテクチャおよび仮想クラウド生成を担うすでに開発済みのミドルウェア Virtual Cloud Providerを用いた。2020年度および2023年度までには以下の二つの適用分野でのこのMicro-abilityを用いた実証実験を実施した。 【ゲノム解析分野】実験環境の流通実証をゲノム解析ツール Galaxyの利用者コミュニティメンバの協力を得て実施する。具体的には現在クラウド内のマシンイ メージとして流通しているGalaxy実験環境のデータビリティプラットフォームへ移行可能であることを実証する。 【数学分野】実験環境の流通実証を数式処理ツールの利用者コミュニティメンバの協力を得て実施する。
|