研究課題/領域番号 |
19K12011
|
研究機関 | 国立研究開発法人海洋研究開発機構 |
研究代表者 |
杉山 大祐 国立研究開発法人海洋研究開発機構, 付加価値情報創生部門(情報エンジニアリングプログラム), 准研究副主任 (00816184)
|
研究分担者 |
坪井 誠司 国立研究開発法人海洋研究開発機構, 付加価値情報創生部門(地球情報基盤センター), 上席技術研究員(シニア) (90183871)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | 深層学習 / 地震シミュレーション / 機械学習 / 並列計算 / メタ学習 |
研究実績の概要 |
本研究ではシミュレーション実活用の高度化を目的とし、観測データへの推定精度を向上させるシミュレーション方法を得るための機械学習手法を提案する。今年度は以下の研究を進めた。 地震シミュレーションと深層学習をシームレスに実行する連結実行システムの開発を進め、ヘテロアーキテクチャ(ベクトルエンジン、CPU、GPU)スパコンであるES4へ最適化を行った。また、手法開発の対象となる、スペクトル要素法による地震シミュレーションを訓練データとした深層学習モデルの構築により、観測地震波形の空間伝搬画像から地震の発震時、震源位置、マグニチュードを推定する手法について、観測点が欠測していた場合にも汎化精度が出せるよう、乱数で観測点をわざと減らして学習する手法を開発する改良を行った。 当初予期していない課題として、日本において様々なフォーマットに分かれた教師データ化されていない地震観測データ群の教師データセット化が必要となっている。相互紐付けプログラム、Webクローラプログラム、教師データ化プログラムの開発に向けた課題検討、準備を行った。しかし、プロトタイプを開発して検討した結果、この課題解決のための新たな「日本における地震教師データセットの創出」は作業量が多くさらなる予算がかかるもので、本研究の域を超えた課題であることがわかった。 そこで、箱根火山地域における大量の観測データと震源推定データの対を持つ、神奈川県温泉地学研究所からデータ提供を受け、この領域に対してのシミュレーション計算を行い、限られた計算量ではあるが約3000の仮想地震について計算し深層学習を行い、実際の観測データに対する推定を行い、初期結果の精度と課題を明らかにした。 これら進捗については日本地震学会にて発表を行ったほか、論文化を行い、EPS誌へ投稿中である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
予定していた進捗に加え、欠測している観測点があった場合でも推定精度を落とさないように学習する手法など、対象手法の高度化も行っている。前年度明らかになった課題「日本における地震教師データセットの創出」のプロトタイプ開発を行い、作業量の検討を行い、箱根の観測データへの適用を進めるなど、着実に研究を進めている。また、前年度までにソフトウェア開発、特許申請、GTCなどGPGPUやAIの分野における世界規模の会議での招待講演を行うなど、十分に成果を挙げることができている。
|
今後の研究の推進方策 |
地震シミュレーションと深層学習をシームレスに実行する連結実行システムは、新規導入されたヘテロアーキテクチャのスーパーコンピューターであるES4への最適化を行った。GPUクラスタは5月以降の稼働となるため、上記のヘテロ環境で開発したソフトウェアの実行を行う準備を進める。対象は箱根火山地域とする。初期結果では計算量が大きく足りなかったため、20倍の仮想地震(60000CPU時間を予定)を実行し、連結深層学習を行う予定である。また、現在投稿中の論文のリバイズを進める他、上記の実験の結果の発表の準備も行う。
|
次年度使用額が生じた理由 |
人件費についてデータ処理が可能な人員を探し、見つかり次第人件費として当てる予定としていたが、新型コロナウイルスの影響により都合がつかず、役務としての利用へ充てた。状況を見ながら人件費は次年度も役務として利用を予定する。さらに旅費は当初は招待講演や学会参加の海外渡航費を見込んでいたが、新型コロナウイルスの影響により渡航不可となった。 次年度において結果のまとめのために必要となる物品費として、動画可視化に用いるソフトウェアの購入、学習向け次世代GPUボードなど深層学習用パーツ一式購入などを予定する。
|