2014 Fiscal Year Annual Research Report
エッジヘビィデータ環境下におけるストリーミング計算用非線形フィルタ手法の研究
Project/Area Number |
26280010
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
樋口 知之 統計数理研究所, その他部局等, 所長 (70202273)
|
Co-Investigator(Kenkyū-buntansha) |
中野 慎也 統計数理研究所, 大学共同利用機関等の部局等, 助教 (40378576)
齋藤 正也 東京大学, 医学系研究科, 特任助教 (00470047) [Withdrawn]
有吉 雄哉 統計数理研究所, 大学共同利用機関等の部局等, 特任研究員 (80735019)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 時系列解析 / 逐次データ同化 |
Outline of Annual Research Achievements |
ビッグデータは、ECサイトやソーシャルメディアのようなクラウド上だけでなく、むしろエッジと呼ぶべき、インターネットの終端である計測・観測の現場で大量生産されている。それらをそのままクラウドへ輸送することは、その輸送コストおよび帯域量の観点から現実的でなく、その場で目的に応じたオンライン計算が必須である。その目的のために、機械学習分野ではストリーム計算と呼ばれる研究分野が大きな注目を浴びている一方、大規模な次元の観測ベクトルデータの処理に関しては気象・海況予報分野において逐次データ同化手法の研究がこの20年間継続的になされてきた。本研究では、この異なる特性をもつフィルタリング機能の両者の優れた点を利用した手法の開発を目標とする。 初年度は既存手法の調査と整理にあてた。樋口は機械学習分野のストリーム計算の最新動向を調べた。特に、問題のタイプ(判別問題、回帰問題、…)、入力データの次元、出力データのタイプ、パラメータベクトルの次元、判別関数や回帰モデル等の出力データ表現の種類、学習器内の最適化法、細かい数値技術など、複数項目の観点から整理した手法の分類を行なった。機械学習コミュニティで研究されてきたFOBOSやRDAへの考察はもちろん、Fused Lassoのようなオフラインタイプの最適化問題の便宜的な簡易解法の調査も行なった。中野はデータ同化研究開発センターの我々以外のメンバーとも連携して、逐次データ同化手法、特にアンサンブルベースの逐次フィルタ研究の最前線を調査した。斉藤は中野と協力して、アンサンブル変換カルマンフィルタおよび局所アンサンブル変換カルマンフィルタのコンピュータ上への実装を開始した。各メンバーの調査結果をとりまとめ招待レビュー記事として発表を行なった。さらには、樋口、中野、齋藤の三人で、学会でのチュートリアルセミナーも企画および実施した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
初年度は調査研究が主であった。従って、調査の結果を何らかの形で研究者コミュニティに還元することは、確実な一つの研究成果と考えられる。研究テーマを想起した時の予想通り、ビッグデータ分析法におけるストリーム計算の研究はますます盛んとなり、それらとの関連性の高いエミュレーション研究についても、少しずつではあるがその重要性の認識は高まりつつある。その大きなうねりのなかで、本研究テーマの研究参加者が、調査研究の内容を整理し全体像を俯瞰する形でチュートリアルセミナーを企画できたことは、初年度の研究目的の内容から鑑みると、十分に目的は達成できたと考えられる。また、逐次データ同化手法の今後の方向性を調査した結果は、論文の前書き等にも情報として入れることができ、さらに複数の論文発表にまで至った点は高く自己評価できる。また、多数の国内外の国際会議やワークショップで、本研究テーマに関連した研究内容に関するレビュー的招待講演を行ったことは、本研究テーマが研究者コミュニティから注目されていることの証左である。ただし、非線形フィルタの計算機への実装については、参加者間で充分な議論の時間がとれたとまでは言えず、やや不満が残った。従って総合的観点から研究はおおむね順調に進展していると判断した。
|
Strategy for Future Research Activity |
2年度目は、逐次データ同化手法のストリーム計算への適用可能性を探ることに注力する。特に、ストリーム計算でアドホックに定めていたメタパラメータ(パラメータベクトルに係わる各拘束条件の重み)を、データ適用的に決定するアルゴリズムを考案する。時変メタパラメータの推定には、まず、状態空間モデルでよく利用するハイパーパラメータ(ここではメタパラメータに相当)に対する平滑(smoothness)拘束条件を採用し、その条件も含めて学習器全体を自己組織化状態空間モデルで表現する。この状態空間モデルに対して、パラメータベクトルの推定に最適化を適用する代わりに逐次データ同化手法を適用し、そのアンサンブルから最適化による推定とは異なる特性をもつパラメータベクトルを算出する方策を検討する。 気象・海洋シミュレーション分野において、逐次データ同化(あるいはデータ同化操作無し)で得られた状態ベクトルの系列(プロダクトと呼ばれる)と観測データのセットに対して線形回帰解析を行い、大規模なシミュレーション計算を経ずに予測値を構成する研究が注目を浴びている。特に、時刻t-1の状態ベクトルから時刻tの観測ベクトル内の一要素を予測する操作は、予測エミュレータと呼ばれる。我々は、予測エミュレータへのストリーム計算の適用を模索する。2年目以降は、このような非線形予測エミュレータの計算アルゴリズムの開発に取り組む。中野と斉藤は、Kitagawa非線形問題やLorenz96モデル問題等の非線形フィルタ問題に対して、アンサンブル変換カルマンフィルタおよび局所アンサンブル変換カルマンフィルタを適用し、状態ベクトルの推定精度と計算速度の2面から他フィルタとの比較検討を行なう。
|
Causes of Carryover |
平成26年度後半にそれまでとりまとめた調査研究の内容を総括し発表する機会(チュートリアルセミナーの企画・実施)を得たので、予算を確保し計画していた海外での発表は次年度に回しても十分な研究進捗であると判断したため。
|
Expenditure Plan for Carryover Budget |
平成26年度に実施しなかった国際会議での発表費用および、今年度から本格的に始める非線形フィルタ問題の計算機上での数値実験作業の支援に必要な人件費にあてる。
|
Research Products
(15 results)
-
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] 同床異夢のビッグデータ2014
Author(s)
樋口知之
Organizer
日経ビッグデータ創刊記念フォーラム
Place of Presentation
日経ホール(東京都千代田区)
Year and Date
2014-04-22 – 2014-04-22
Invited
-
-