研究課題/領域番号 |
20K21792
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分60:情報科学、情報工学およびその関連分野
|
研究機関 | 政策研究大学院大学 |
研究代表者 |
土谷 隆 政策研究大学院大学, 政策研究科, 教授 (00188575)
|
研究分担者 |
上野 玄太 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 教授 (40370093)
田中 未来 統計数理研究所, 数理・推論研究系, 准教授 (40737053)
池上 敦子 成蹊大学, その他部局等, 客員研究員 (90146936)
|
研究期間 (年度) |
2020-07-30 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
5,070千円 (直接経費: 3,900千円、間接経費: 1,170千円)
2021年度: 2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
2020年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
|
キーワード | 深層学習 / 信号復元 / Geotail / 磁気リコネクション / プラズマ粒子分布 / 人工衛星 / プラズマ粒子 / 線形計画 / GEOTAIL / 整数計画 / 数理計画法 / 人工衛星データ / 線形計画法 |
研究開始時の研究の概要 |
Geotail は磁気圏観測を目的として1992 年に打ち上げられ, 今なお稼動している人工衛星である. 本研究の対象となるのは同衛星により観測された低エネルギー粒子観測データである. 観測されるのはプラズマ粒子の分布の3次元ヒストグラムであるが,Geotailは1日の内16時間分を「2 次元ヒストグラム+ 10 個の統計量」の圧縮された形で地上に送信する.本研究では, 圧縮した形で取得されたプラズマ粒子の分布のデータ(12 秒毎, 16 時間/日, 28 年分) を, 線形計画法と深層学習を駆使して3次元ヒストグラムに復元するための手法を開発し, さらに復元されたデータを元に解析を行う.
|
研究実績の概要 |
本研究の目的は、磁気圏尾部観測衛星GEOTAILが観測して圧縮した形で地上に送ってきた低エネルギープラズマ粒子の3次元分布データ(入射方向2次元(緯度方向7成分と経度方向16成分)、エネルギー強度1次元32成分)を復元することである。この3次元分布は3584成分のヒストグラムで表現されるが,圧縮されたデータは緯度方向を周辺化して2次元に圧縮された512成分ヒストグラムと10個の統計量である。一日の内8時間は3次元分布データが送られてくるが、残り16時間については、圧縮されたデータが送られてくる。3次元データが送られる8時間分を復元の学習用に用いることができる。 観測者は3次元分布データから求められるEtスペクトログラムと呼ばれる可視化グラフを用いて科学的推論を行う。このデータを用いる研究の目的の一つに磁気リコネクションを発見することが挙げられるが、本研究により、復元データから新たな現象の解析が期待できる。 本年度は、学習データの不均衡性について検討した。地球惑星科学的に興味深い部分は尖った分布をしていることが多いが、それに対応する学習データは十分にあるとは言えず, データの補正が必要になる。不均衡データの対応策としては、本研究の場合、オーバーサンプリングの手法が挙げられるが、Synthetic Minority Over-sampling Technique(SMOTE)等は、データの復元(合成)には有効であるとは言えないことが分かった。データ変換については、回転、並行移動、拡大縮小、切り抜き、反転に加え、ノイズ挿入を検討している。モデリングについては, 各時刻毎のデータの復元ではなく、時系列データとしての復元が考えられる. 大規模言語モデルとして注目を集めているAttentionを用いたモデル、Transformer等を用いた復元を試みた。
|