研究課題/領域番号 |
16K12466
|
研究機関 | 国立情報学研究所 |
研究代表者 |
北本 朝展 国立情報学研究所, コンテンツ科学研究系, 准教授 (00300707)
|
研究期間 (年度) |
2016-04-01 – 2018-03-31
|
キーワード | 画像情報処理 / 気象情報 / 衛星画像 / 深層学習 / 台風 |
研究実績の概要 |
本研究は、台風等の顕著な気象現象の分析を目指し、気象ビッグデータに対して深層表現学習を有効に活用する方法を探求する。研究代表者は約40年間に及ぶ気象衛星ひまわり観測データを、長期時系列データとして分析可能な状態に維持しており、これをその他の長期観測データと統合的に解析することで、深層表現学習の有効性を検証するというのが基本的な方針である。本年度は特に、予備的な実験の実施をマイルストーンとして研究を進めた。 実験1では、時系列画像を独立した画像として扱い、CNNを用いて台風クラスの分類または台風中心気圧の回帰を学習させる問題に取り組んだ。その結果として、台風クラスの分類よりも台風中心気圧の回帰の方が良好な性能を達成できるとの結果を得た。その理由は、もともと台風の勢力(=中心気圧)が連続値であるのに対して、台風クラスはそれを人間可読性のために離散化したカテゴリであることから、連続値の小さな誤差が離散値では拡大することが一つの原因と考えられる。 実験2では、時系列画像に対して時系列モデルLSTMを適用し、台風中心気圧の回帰を学習させる問題に取り組んだ。その結果として、台風の系列ごとに誤差が小さいパターンと大きいパターンに分かれるとの結果を得た。ただし誤差が大きい一部のパターンは、時系列モデルの初期値の誤差が解消しないことが原因であることから、時系列モデルに入力するデータの初期化に工夫を加えることで性能が向上することがわかった。 以上の結果から、台風画像の勢力を推定する問題に対しては、時系列モデル(LSTM)の活用が鍵を握るというのが現状の結論である。ただしこれはまだ予備的な実験であり、データの前処理や欠損値の扱い等についてはまだ改善の余地がある。今後はこれらの問題を詳細に分析することで、より信頼度の高い結果を得ることを目標とする。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
予備的な実験を実施するというマイルストーンを達成できたことから、おおむね順調に進展したと評価する。 予備的な実験を進めるために、以下の準備を行った。まずデータセットの整備として、約40年分の台風画像コレクションを深層学習ライブラリで扱いやすいHDF5フォーマットに変換し、メタデータも含めて自己記述的なデータセットとして整備した。そして深層学習の計算を高速化する計算機環境を新たに整備し、大規模データを用いた学習でパフォーマンスを計測した。 このように研究環境のインフラストラクチャを整備することで、今後はより多くの実験と評価を重ねていくことができると考えている。
|
今後の研究の推進方策 |
今後の研究で解決すべき課題として、以下の2点を挙げる。 第一に、時系列データの活用である。今年度も行ったように学習モデルの時系列化が一つの課題ではあるが、それに加えて画像処理を用いた時系列的な特徴抽出に取り組むことがもう一つの課題となる。今年度に利用した長期観測の低頻度気象衛星画像(1時間間隔)では、時間間隔が大きすぎて時間変化を時系列画像から捉えることが難しかったが、今後利用する最新のひまわり8号による高頻度気象衛星画像(2.5分間隔)では、時間間隔が十分に狭いため時系列画像から大気のダイナミクスを直接分析することも可能となる。こうした分析から得られる時間方向の画像特徴の活用は、画像よりもむしろ映像への深層学習の適用と共通する課題が多いが、これは未だに萌芽的かつ挑戦的なテーマと認識されていることから、ここは探究する価値が高いテーマであると考えている。 第二に、問題設定の明確化である。モデルに学習させるデータと学習結果の評価基準は、台風という気象学的な現象や、台風によって起こる災害という社会的な影響を反映したものであることが望ましい。しかし何がよい基準かは機械学習の枠を越える問題であり、気象学者らと議論しながら決めていく必要がある。これは機械学習を実世界問題の解決に利用する際の一般的な課題であることから、適切な評価基準を決める部分までを含めた学習問題としてその解決に取り組むことを考えている。
|