2023 Fiscal Year Annual Research Report
線形計画法と深層学習による人工衛星データの復元と解析
Project/Area Number |
20K21792
|
Research Institution | National Graduate Institute for Policy Studies |
Principal Investigator |
土谷 隆 政策研究大学院大学, 政策研究科, 教授 (00188575)
|
Co-Investigator(Kenkyū-buntansha) |
上野 玄太 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 教授 (40370093)
田中 未来 統計数理研究所, 数理・推論研究系, 准教授 (40737053)
池上 敦子 成蹊大学, その他部局等, 客員研究員 (90146936)
|
Project Period (FY) |
2020-07-30 – 2024-03-31
|
Keywords | 深層学習 / 信号復元 / Geotail / 磁気リコネクション / プラズマ粒子分布 |
Outline of Annual Research Achievements |
本研究の目的は、磁気圏尾部観測衛星GEOTAILが観測して圧縮した形で地上に送ってきた低エネルギープラズマ粒子の3次元分布データ(入射方向2次元(緯度方向7成分と経度方向16成分)、エネルギー強度1次元32成分)を復元することである。この3次元分布は3584成分のヒストグラムで表現されるが,圧縮されたデータは緯度方向を周辺化して2次元に圧縮された512成分ヒストグラムと10個の統計量である。一日の内8時間は3次元分布データが送られてくるが、残り16時間については、圧縮されたデータが送られてくる。3次元データが送られる8時間分を復元の学習用に用いることができる。 観測者は3次元分布データから求められるEtスペクトログラムと呼ばれる可視化グラフを用いて科学的推論を行う。このデータを用いる研究の目的の一つに磁気リコネクションを発見することが挙げられるが、本研究により、復元データから新たな現象の解析が期待できる。 本年度は、学習データの不均衡性について検討した。地球惑星科学的に興味深い部分は尖った分布をしていることが多いが、それに対応する学習データは十分にあるとは言えず, データの補正が必要になる。不均衡データの対応策としては、本研究の場合、オーバーサンプリングの手法が挙げられるが、Synthetic Minority Over-sampling Technique(SMOTE)等は、データの復元(合成)には有効であるとは言えないことが分かった。データ変換については、回転、並行移動、拡大縮小、切り抜き、反転に加え、ノイズ挿入を検討している。モデリングについては, 各時刻毎のデータの復元ではなく、時系列データとしての復元が考えられる. 大規模言語モデルとして注目を集めているAttentionを用いたモデル、Transformer等を用いた復元を試みた。
|