研究課題/領域番号 |
22K03768
|
研究機関 | 国立研究開発法人海洋研究開発機構 |
研究代表者 |
杉山 大祐 国立研究開発法人海洋研究開発機構, 付加価値情報創生部門(地球情報科学技術センター), 准研究副主任 (00816184)
|
研究分担者 |
山本 揚二朗 国立研究開発法人海洋研究開発機構, 海域地震火山部門(地震津波予測研究開発センター), 副主任研究員 (10540859)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
キーワード | 深層学習 / 低周波地震 / 並列計算 / 機械学習 / 地震イベント検出 |
研究実績の概要 |
本研究では地震や低周波地震・超低周波地震等のイベント自動検出技術の高度化を目指し、新しい深層学習モデル創出に必須となる、数百TBクラスの連続波形データを並列GPU学習・推定可能とする地震学向け深層学習フレームワークを開発する。今年度は以下の研究を進めた。 並列深層学習フレームワーク初版の開発を進め、ヘテロアーキテクチャ(ベクトルエンジン、CPU、GPU)スパコンであるES4において、ES4GPUで稼働させるための開発、および最適化を進めた。 開発中の並列深層学習フレームワークを評価するためには、実際に評価対象となる教師データセットが必要である。そのため、南海トラフ沖海底観測網(DONET)のデータのうち20TB前後の連続観測データを連携者より受領して解析を行った。そして、DONETが採用している連続波形記録およびイベントの記録システムであるWINシステムのDONETデータを、深層学習向けの教師データセットへ変換するプログラムを開発した。ES4GPUで高効率に並列学習プログラムを稼働させるために必要となるデータフォーマットを検討して初版を決定し、そのフォーマットへの変換を行える機能を持つプログラムである。初版としてまずこの20TB程度のデータでフレームワークを用いて並列学習を進め、次年度の準備を整えた。次年度は、教師データセットへ変換するプログラムの整合性の検証を重点的に行ってから、実際にイベント検出などの深層学習を行い、残課題や性能上の問題点の洗い出しを行う予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
並列深層学習フレームワーク開発が予定通り進み、さらにDONET観測網のデータを変換して評価を行うためのプログラムも開発している。 本フレームワークが何百TBに及ぶ大規模連続波形データを深層学習等の先端技術で学習・推定できるということを検証するため、このDONET観測網のデータを用いる予定である。このように、次年度以降のフレームワーク開発や論文化に向けての準備は十分に整っている。
|
今後の研究の推進方策 |
次年度は、作成した教師データセットについて整合性検証を入念に行う。開発中の並列深層学習フレームワークからの読み出し処理の開発を行う。そして準備が完了した教師データセットで並列深層学習フレームワークの初版を並列深層学習して評価し、課題や性能を明らかにする。洗い出された課題について検討し、課題解決およびプログラム実行性能の最適化などの対応を行う。明らかになった課題や性能、そして対応については整理し、最終年度に向けたプログラム公開、成果のまとめ論文化について準備を行う。
|
次年度使用額が生じた理由 |
プログラム開発の一部モジュールを人件費で開発補助する予定であったが、技術難易度が高く研究代表者が実施した。次年度、予算額に合えば、特にWINフォーマットの整合性確認業務や、外部ライブラリの実行環境作成などの外注、またはM.2 SSDなどの高速ストレージなどの購入に充てる予定。
|