研究課題/領域番号 |
17K00158
|
研究機関 | 愛媛大学 |
研究代表者 |
本田 理恵 愛媛大学, データサイエンスセンター, 教授 (80253334)
|
研究分担者 |
村田 健史 国立研究開発法人情報通信研究機構, 総合テストベッド研究開発推進センター, 研究統括 (20274342)
佐藤 晋介 国立研究開発法人情報通信研究機構, 電磁波研究所リモートセンシング研究室, 研究マネージャー (30358981)
佐々 浩司 高知大学, 教育研究部自然科学系理工学部門, 教授 (50263968)
村田 文絵 高知大学, 教育研究部自然科学系理工学部門, 講師 (60399326)
|
研究期間 (年度) |
2017-04-01 – 2023-03-31
|
キーワード | 時空間データマイニング / オブジェクト抽出 / CNN / 深層学習 / フェーズドアレイ / 漏斗雲 / オブジェクト追跡 / 混合分布 |
研究実績の概要 |
本研究課題の目的は、気象に関する時空間のビッグデータから機械学習の手法を用いて時空間変動パターンを抽出し、これを基にした知識発見支援システムを 構築することである。具体的な事例として、ひまわり8号画像や3次元気象レーダデータに展開し、webからの参照やアラーティングが可能なシステムを開発することを目指している。この際、バックエンドに分散処理システムを構築し、大規模データへの効率の良いアクセスと高速な処理を確保するものとしている。 本年度は、バックエンドシステムに本格的に取り組み、分散処理フレームワークHadoopの後継であるSparkにCUDAを介しての並列計算を可能にするNumbaを取り入れることによる高速化を試みた。PySpark上でpythonでGPUによる並列化を実行できるNumbaを用いて実装を完了したが,各種ツールのバージョンのマッチングなどの問題でGPUモードが起動しなかったため,CPUモードで評価を行ない、引き続き検討中である。ただ、その過程で例えば、実験環境として用いたGPUであるNVIDIA GTX1080Tiに含まれるCUDAコアは3584であるが実際の高速化の効率はCPU比で10倍程度にしかならず、GPUによる並列化だけに頼らず、引き続き分散システムや、アルゴリズムの安定化なども含めて,バランスの良い高速化を今後検討する必要がわかった。またフェーズドアレイデータからの降水コア検出に向けて検討していた、Greedy EMによるモデリング手法において、グリッドデータの点群近似によって不自然な分裂が起こっていたことがわかったためアルゴリズムを改良法を検討した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
研究自体は概ね順調であるが新型コロナ関連で学会がオンライン開催、中止されるなどして年度末までに旅費の執行が完了しなかったため、研究延長依頼を行なった。
|
今後の研究の推進方策 |
研究代表者の所属変更もあったため、要素となる手法やプロトタイプシステムに軸足を移して、論文の執筆・投稿を中心に進めていく。また昨年度、一昨年度と実施できなかった、共同研究者との会合もリモート会議を利用して行い、研究の収束につなげていく予定である。
|
次年度使用額が生じた理由 |
新型コロナの影響による学会などのオンライン化により、旅費としての使用が難しかった。R4年度は備品や謝金などに振り替えて、課題の終了を目指す。
|