2023 Fiscal Year Research-status Report
大規模地震観測データの並列GPU学習基盤フレームワークの開発
Project/Area Number |
22K03768
|
Research Institution | Japan Agency for Marine-Earth Science and Technology |
Principal Investigator |
杉山 大祐 国立研究開発法人海洋研究開発機構, 付加価値情報創生部門(地球情報科学技術センター), 准研究主任 (00816184)
|
Co-Investigator(Kenkyū-buntansha) |
山本 揚二朗 国立研究開発法人海洋研究開発機構, 海域地震火山部門(地震津波予測研究開発センター), 主任研究員 (10540859)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | 深層学習 / 低周波地震 / 並列計算 / 機械学習 / 地震イベント検出 |
Outline of Annual Research Achievements |
本研究では地震や低周波地震・超低周波地震等のイベント自動検出技術の高度化を目指し、新しい深層学習モデル創出に必須となる、数百TBクラスの連続波形データを並列GPU学習・推定可能とする地震学向け深層学習フレームワークを開発する。今年度は以下の研究を進めた。 並列深層学習フレームワークの開発を進め、ヘテロアーキテクチャ(ベクトルエンジン、CPU、GPU)スパコンであるES4において、ES4GPUで稼働させるための開発および最適化を進めた。 開発中の並列深層学習フレームワークを評価するためには、評価対象となる教師データセットが必要である。そのため、南海トラフ沖海底観測網(DONET)のデータのうち20TB前後の連続観測データを連携者より受領して解析を行った。そして、DONETが採用している連続波形記録およびイベントの記録システムであるWINシステムのDONETデータを、深層学習向けの教師データセットへ変換するプログラムを開発した。ES4GPUで高効率に並列学習プログラムを稼働させるため、seisbenchと呼ばれるOSSにて採用されている汎用的な学習用のフォーマットを採用した。今年度は、教師データセットへ変換するプログラムの整合性の検証を重点的に行った。結果、DONETの連続波形データにはいくつかの課題(物理量への変換に時期差があるなど)があり、これを修正し、一般的なデータセットへ整備できるプログラムを開発した。この整備された教師データセットは、フレームワークの評価対象としてだけでなく、DONETの観測データにおいて機械学習を適用する研究にも有用である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
並列深層学習フレームワーク開発が予定通り進み、さらにDONET観測網のデータを変換して評価を行うためのプログラムも開発している。 本フレームワークが何百TBに及ぶ大規模連続波形データを深層学習等の先端技術で学習・推定できるということを検証するため、このDONET観測網のデータを用いる予定である。このように、最終年度のフレームワークの開発完了と結果のまとめ、学会発表などに向けての準備は十分に整っている。
|
Strategy for Future Research Activity |
最終年度はこの教師データセットをターゲットとし、並列深層学習フレームワークを成果としてまとめていく。デバッグや性能の測定などを行い、明らかになった課題や性能について整理し、地震学会などでの発表を行う。外部公開の開始は、フレームワークが完成したあとに、所属機関の厳重なセキュリティチェックがありデータ公開にはかなり時間がかかるため、最終年度の次年度になる予定である。
|
Causes of Carryover |
プログラム開発の一部モジュールを人件費で開発補助する予定であったが、技術難易度が高く困難だったため研究代表者が実施した。次年度、予算額に合えば、フレームワークに可視化機能を付与(連続地震波形についてイベント情報表示・周波数成分のランニングスペクトル可視化)する部分的なソフトウェア開発、GPU計算機、M.2 SSDなどの高速ストレージなどの購入に充てる予定。
|