研究課題/領域番号 |
19K11895
|
研究機関 | 国立情報学研究所 |
研究代表者 |
横山 重俊 国立情報学研究所, オープンサイエンス基盤研究センター, 特任研究員 (10600968)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
キーワード | 研究再現性 / データ駆動型研究 / ゲノム解析 / 実験数学 / クラウドコンピューティング / Jupyter Notebook |
研究実績の概要 |
本研究では、ICT基盤上に構築された実験環境の再現性をコンテナ技術によるオーバーレイクラウド方式の仮想クラウド技術と実行可能な構築手順書構成技術(Literate Computing for Infrastructure)を組み合わせることで、データ駆動型研究実験環境の流通性を飛躍的に高めることを目指す。2019年度には本研究の基本構成要素であるControl DataとControlled EnvironmentからなるMicro-abilityのプロトタイプを実現した。Control DataとしてはLiterate Computing for Infrastructureの研究成果であるJupyter Notebookによる実行可能構築手順書を用いる。これはインフラ構築のための実行スクリプトと構築手順同時に記述するだけではなく、実行結果の保存も可能としている。Controlled Environmentとしては各種クラウド上に跨った仮想クラウドを動的に構築できるコンテナ技術を利用したOverlay Cloudアーキテクチャおよび仮想クラウド生成を担うすでに開発済みのミドルウェア Virtual Cloud Providerを用いた。2020年度および2022年度までには以下の二つの適用分野でのこのMicro-abilityを用いた実証実験を実施した。 【ゲノム解析分野】実験環境の流通実証をゲノム解析ツール Galaxyの利用者コミュニティメンバの協力を得て実施する。具体的には現在クラウド内のマシンイメージとして流通しているGalaxy実験環境のデータビリティプラットフォームへ移行可能であることを実証する。 【数学分野】実験環境の流通実証を数式処理ツールの利用者コミュニティメンバの協力を得て実施する。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究は以下の4タスクから構成されている。(1)本研究の基本構成要素であるControl DataとControlled EnvironmentからなるMicro-abilityを実現する(2)ゲノム解析分野への適(3)数学分野への適用(4)分野を跨った実験環境の流通にデータビリティプラットフォームが活用できることの実証。タスク(2)とタスク(3)ではタスク(1)の成果を活用し、さらにその適用によりMicro-abilityへのフィードバックを行いその改善につなげる。タスク(4)はタスク(1)からタスク(3)の成果をさらに適用領域の普及につなげる活動である。2019年度には、タスク(1)に着手し、プロトタイプを実現することで度教育実践研究の場での試用を行った。2020年度以降の得られた成果としてMicro-abilityの構築ノウハウと適用実践については情報処理学会、数学教育学会などで発表を行なった。2020年度には、ゲノム解析分野への適用と数学分野への適用に着手した。2021年度は以下の活動を進めた。(1)その適用領域内でのMicro-ability試用実験継続(2)適用分野のコミュニティへのMicro-ability利用に向けたアピールを継続(3)適用分野で実証実験を継続(4)得られた成果の論文発表 2022年度には、数学分野への適用をさらに進め、上記二つの環境の連携についてコミュニティのメンバの協力を得て取り組み、実験環境の流通にデータビリティプラットフォームが実用的であることを実証した。
|
今後の研究の推進方策 |
2023年度には、数学分野への適用をさらに進め、上記二つの環境の連携についてコミュニティのメンバの協力を得て取り組み、実験環境の流通にデータビリティプラットフォームが実用的であることをさらに実証する。 (1)実際に投稿されている最新の論文との連携をさらに進める。 (2)arXivやPapers with codeなどの既存の情報共有サービスとの連携をさらに進める。
|
次年度使用額が生じた理由 |
コロナによるオンサイトでの学会発表の延期
|