Project/Area Number |
19K11895
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60050:Software-related
|
Research Institution | National Institute of Informatics (2021-2022) Gunma University (2019-2020) |
Principal Investigator |
横山 重俊 国立情報学研究所, オープンサイエンス基盤研究センター, 特任研究員 (10600968)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
Fiscal Year 2021: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2020: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2019: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
|
Keywords | 研究再現性 / データ駆動型研究 / ゲノム解析 / 実験数学 / クラウドコンピューティング / Jupyter Notebook / クラウド / 計算科学 / データ科学 / 再現性 |
Outline of Research at the Start |
科学論文の再現性は長年の課題である。本研究では、データ駆動型研究実験環境の流通を促進するデータビリティプラットフォームの普及を目指す。具体的には、ICT基盤上に構築された実験環境の再現性をコンテナ技術を用いたオーバーレイクラウド方式の仮想クラウド技術と実行可能な構築手順書構成技術(Literate Computing for Infrastructure)を組み合わせたデータビリティプラットフォームを導入することでデータ駆動型研究実験環境の流通性を飛躍的に高める。さらに複数の実験環境を連携させる仕組みを導入することで、複数分野に跨るデータ駆動型研究の推進やデータ駆動型研究人材の育成に貢献する。
|
Outline of Annual Research Achievements |
本研究では、ICT基盤上に構築された実験環境の再現性をコンテナ技術によるオーバーレイクラウド方式の仮想クラウド技術と実行可能な構築手順書構成技術(Literate Computing for Infrastructure)を組み合わせることで、データ駆動型研究実験環境の流通性を飛躍的に高めることを目指す。2019年度には本研究の基本構成要素であるControl DataとControlled EnvironmentからなるMicro-abilityのプロトタイプを実現した。Control DataとしてはLiterate Computing for Infrastructureの研究成果であるJupyter Notebookによる実行可能構築手順書を用いる。これはインフラ構築のための実行スクリプトと構築手順同時に記述するだけではなく、実行結果の保存も可能としている。Controlled Environmentとしては各種クラウド上に跨った仮想クラウドを動的に構築できるコンテナ技術を利用したOverlay Cloudアーキテクチャおよび仮想クラウド生成を担うすでに開発済みのミドルウェア Virtual Cloud Providerを用いた。2020年度および2022年度までには以下の二つの適用分野でのこのMicro-abilityを用いた実証実験を実施した。 【ゲノム解析分野】実験環境の流通実証をゲノム解析ツール Galaxyの利用者コミュニティメンバの協力を得て実施する。具体的には現在クラウド内のマシンイメージとして流通しているGalaxy実験環境のデータビリティプラットフォームへ移行可能であることを実証する。 【数学分野】実験環境の流通実証を数式処理ツールの利用者コミュニティメンバの協力を得て実施する。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究は以下の4タスクから構成されている。(1)本研究の基本構成要素であるControl DataとControlled EnvironmentからなるMicro-abilityを実現する(2)ゲノム解析分野への適(3)数学分野への適用(4)分野を跨った実験環境の流通にデータビリティプラットフォームが活用できることの実証。タスク(2)とタスク(3)ではタスク(1)の成果を活用し、さらにその適用によりMicro-abilityへのフィードバックを行いその改善につなげる。タスク(4)はタスク(1)からタスク(3)の成果をさらに適用領域の普及につなげる活動である。2019年度には、タスク(1)に着手し、プロトタイプを実現することで度教育実践研究の場での試用を行った。2020年度以降の得られた成果としてMicro-abilityの構築ノウハウと適用実践については情報処理学会、数学教育学会などで発表を行なった。2020年度には、ゲノム解析分野への適用と数学分野への適用に着手した。2021年度は以下の活動を進めた。(1)その適用領域内でのMicro-ability試用実験継続(2)適用分野のコミュニティへのMicro-ability利用に向けたアピールを継続(3)適用分野で実証実験を継続(4)得られた成果の論文発表 2022年度には、数学分野への適用をさらに進め、上記二つの環境の連携についてコミュニティのメンバの協力を得て取り組み、実験環境の流通にデータビリティプラットフォームが実用的であることを実証した。
|
Strategy for Future Research Activity |
2023年度には、数学分野への適用をさらに進め、上記二つの環境の連携についてコミュニティのメンバの協力を得て取り組み、実験環境の流通にデータビリティプラットフォームが実用的であることをさらに実証する。 (1)実際に投稿されている最新の論文との連携をさらに進める。 (2)arXivやPapers with codeなどの既存の情報共有サービスとの連携をさらに進める。
|
Report
(4 results)
Research Products
(20 results)