2020 Fiscal Year Research-status Report
テラバイト超データ高速可視化システム等によるALMAデータ検索機能の強化
Project/Area Number |
20K04030
|
Research Institution | National Astronomical Observatory of Japan |
Principal Investigator |
白崎 裕治 国立天文台, 天文データセンター, 助教 (70322667)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 可視化システム / データアーカイブ / 分散処理 / ALMA |
Outline of Annual Research Achievements |
本研究では ALMA 電波望遠鏡により取得された大規模データを高速に可視化するシステムを構築することを目的とする。また、ALMA で検出されたライン情報をデータベース化することにより、データの中身検索を行える機能を実現することも本研究の課題である。
令和二年度には、最初の開発ステップとして、単一の計算機上で画像読み込みを並列化することにより高速にデータ表示する機能の開発を行い、従来の方法に比べて数倍の速度で画像を読み込む機能の開発に成功した。その後第二ステップとして四台の計算機を用いた高速データ読み込み機能の開発を進めた。四台の計算機でデータを共有するために分散ファイルシステムの一つである Gluster ファイルシステムを導入したが、データ読み込み速度がローカルファイルシステムでの速度に比べて低速であることが分かった。そのため、分割されたデータ群はローカルファイルシステム上に配置することとし、Gluster ファイルシステムは元データを共有するためのデータ置き場として活用することとした。
中身検索機能については、当初の計画では令和二年度中にライン検出のためのパイプラインを完成させる予定であったが遅れが生じている。理由としてはライン検出機能を自主開発するか既存のソフトを利用するかの選定が完了していないことがあげられる。令和三年度の早い段階で既存ソフトの機能調査を完了しどちらの方向で進めるのかを決定する予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
大規模データの可視化システムの開発はほぼ順調に進んでいるものの、当初の計画にはなかった FORTRAN の COARRAY 機能を使った実装について検討を進めたことにより作業規模が膨らみ若干の遅れが生じている。また、中身検索機能についても遅れが生じているが、いずれも研究期間内には当初予定の計画を完了することは現時点は可能であると予想している。
|
Strategy for Future Research Activity |
当初の計画どおり、大規模データ可視化システムについては令和三年度中に実装方式を確定し、PCクラスタ上でのシステム稼働をめざし、令和四年度には運用システムへむけた安定稼働のための最終確認を行う予定である。中身検索機能についても、令和三年度中にライン検出パイプラインを完成させ、全データについてライン検出を行い、令和四年度中にデータベース化と検索のためのユーザインターフェイスの作成を行う予定である。
|