大規模地震観測データの並列GPU学習基盤フレームワークの開発
Project/Area Number |
22K03768
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 17040:Solid earth sciences-related
|
Research Institution | Japan Agency for Marine-Earth Science and Technology |
Principal Investigator |
杉山 大祐 国立研究開発法人海洋研究開発機構, 付加価値情報創生部門(地球情報科学技術センター), 准研究主任 (00816184)
|
Co-Investigator(Kenkyū-buntansha) |
山本 揚二朗 国立研究開発法人海洋研究開発機構, 海域地震火山部門(地震津波予測研究開発センター), 主任研究員 (10540859)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000)
Fiscal Year 2024: ¥390,000 (Direct Cost: ¥300,000、Indirect Cost: ¥90,000)
Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2022: ¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
|
Keywords | 深層学習 / 低周波地震 / 並列計算 / 機械学習 / 地震イベント検出 / 地震シミュレーション / GPU並列計算 / フレームワーク開発 |
Outline of Research at the Start |
南海トラフ沖を始めとする海底観測網で観測されるゆっくり起こる地震、つまり低周波地震・超低周波地震等には、人間に発見できなかった未発見の地震があるのだろうか?これらのシグナルはノイズとの違いが不鮮明、そして長期間に渡る観測であることから正確な答えを出すのは困難である。数百TBの地震観測データをAIで学習し、これらの自動検出技術を創出するため、高速に並列GPU学習・推定可能な地震学向け並列深層学習フレームワークを開発する。フレームワークの有効性が確認できれば、地震イベントのカタログ作成の高精度自動化への基盤となるだけでなく、巨大地震発生過程へ知見提供など波及効果が期待できる。
|
Outline of Annual Research Achievements |
本研究では地震や低周波地震・超低周波地震等のイベント自動検出技術の高度化を目指し、新しい深層学習モデル創出に必須となる、数百TBクラスの連続波形データを並列GPU学習・推定可能とする地震学向け深層学習フレームワークを開発する。今年度は以下の研究を進めた。 並列深層学習フレームワークの開発を進め、ヘテロアーキテクチャ(ベクトルエンジン、CPU、GPU)スパコンであるES4において、ES4GPUで稼働させるための開発および最適化を進めた。 開発中の並列深層学習フレームワークを評価するためには、評価対象となる教師データセットが必要である。そのため、南海トラフ沖海底観測網(DONET)のデータのうち20TB前後の連続観測データを連携者より受領して解析を行った。そして、DONETが採用している連続波形記録およびイベントの記録システムであるWINシステムのDONETデータを、深層学習向けの教師データセットへ変換するプログラムを開発した。ES4GPUで高効率に並列学習プログラムを稼働させるため、seisbenchと呼ばれるOSSにて採用されている汎用的な学習用のフォーマットを採用した。今年度は、教師データセットへ変換するプログラムの整合性の検証を重点的に行った。結果、DONETの連続波形データにはいくつかの課題(物理量への変換に時期差があるなど)があり、これを修正し、一般的なデータセットへ整備できるプログラムを開発した。この整備された教師データセットは、フレームワークの評価対象としてだけでなく、DONETの観測データにおいて機械学習を適用する研究にも有用である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
並列深層学習フレームワーク開発が予定通り進み、さらにDONET観測網のデータを変換して評価を行うためのプログラムも開発している。 本フレームワークが何百TBに及ぶ大規模連続波形データを深層学習等の先端技術で学習・推定できるということを検証するため、このDONET観測網のデータを用いる予定である。このように、最終年度のフレームワークの開発完了と結果のまとめ、学会発表などに向けての準備は十分に整っている。
|
Strategy for Future Research Activity |
最終年度はこの教師データセットをターゲットとし、並列深層学習フレームワークを成果としてまとめていく。デバッグや性能の測定などを行い、明らかになった課題や性能について整理し、地震学会などでの発表を行う。外部公開の開始は、フレームワークが完成したあとに、所属機関の厳重なセキュリティチェックがありデータ公開にはかなり時間がかかるため、最終年度の次年度になる予定である。
|
Report
(2 results)
Research Products
(1 results)