• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実績報告書

エッジヘビィデータ環境下におけるストリーミング計算用非線形フィルタ手法の研究

研究課題

研究課題/領域番号 26280010
研究機関統計数理研究所

研究代表者

樋口 知之  統計数理研究所, その他部局等, 所長 (70202273)

研究分担者 中野 慎也  統計数理研究所, 大学共同利用機関等の部局等, 助教 (40378576)
齋藤 正也  東京大学, 医学系研究科, 特任助教 (00470047) [辞退]
有吉 雄哉  統計数理研究所, 大学共同利用機関等の部局等, 特任研究員 (80735019)
研究期間 (年度) 2014-04-01 – 2017-03-31
キーワード時系列解析 / 逐次データ同化
研究実績の概要

ビッグデータは、ECサイトやソーシャルメディアのようなクラウド上だけでなく、むしろエッジと呼ぶべき、インターネットの終端である計測・観測の現場で大量生産されている。それらをそのままクラウドへ輸送することは、その輸送コストおよび帯域量の観点から現実的でなく、その場で目的に応じたオンライン計算が必須である。その目的のために、機械学習分野ではストリーム計算と呼ばれる研究分野が大きな注目を浴びている一方、大規模な次元の観測ベクトルデータの処理に関しては気象・海況予報分野において逐次データ同化手法の研究がこの20年間継続的になされてきた。本研究では、この異なる特性をもつフィルタリング機能の両者の優れた点を利用した手法の開発を目標とする。
初年度は既存手法の調査と整理にあてた。樋口は機械学習分野のストリーム計算の最新動向を調べた。特に、問題のタイプ(判別問題、回帰問題、…)、入力データの次元、出力データのタイプ、パラメータベクトルの次元、判別関数や回帰モデル等の出力データ表現の種類、学習器内の最適化法、細かい数値技術など、複数項目の観点から整理した手法の分類を行なった。機械学習コミュニティで研究されてきたFOBOSやRDAへの考察はもちろん、Fused Lassoのようなオフラインタイプの最適化問題の便宜的な簡易解法の調査も行なった。中野はデータ同化研究開発センターの我々以外のメンバーとも連携して、逐次データ同化手法、特にアンサンブルベースの逐次フィルタ研究の最前線を調査した。斉藤は中野と協力して、アンサンブル変換カルマンフィルタおよび局所アンサンブル変換カルマンフィルタのコンピュータ上への実装を開始した。各メンバーの調査結果をとりまとめ招待レビュー記事として発表を行なった。さらには、樋口、中野、齋藤の三人で、学会でのチュートリアルセミナーも企画および実施した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

初年度は調査研究が主であった。従って、調査の結果を何らかの形で研究者コミュニティに還元することは、確実な一つの研究成果と考えられる。研究テーマを想起した時の予想通り、ビッグデータ分析法におけるストリーム計算の研究はますます盛んとなり、それらとの関連性の高いエミュレーション研究についても、少しずつではあるがその重要性の認識は高まりつつある。その大きなうねりのなかで、本研究テーマの研究参加者が、調査研究の内容を整理し全体像を俯瞰する形でチュートリアルセミナーを企画できたことは、初年度の研究目的の内容から鑑みると、十分に目的は達成できたと考えられる。また、逐次データ同化手法の今後の方向性を調査した結果は、論文の前書き等にも情報として入れることができ、さらに複数の論文発表にまで至った点は高く自己評価できる。また、多数の国内外の国際会議やワークショップで、本研究テーマに関連した研究内容に関するレビュー的招待講演を行ったことは、本研究テーマが研究者コミュニティから注目されていることの証左である。ただし、非線形フィルタの計算機への実装については、参加者間で充分な議論の時間がとれたとまでは言えず、やや不満が残った。従って総合的観点から研究はおおむね順調に進展していると判断した。

今後の研究の推進方策

2年度目は、逐次データ同化手法のストリーム計算への適用可能性を探ることに注力する。特に、ストリーム計算でアドホックに定めていたメタパラメータ(パラメータベクトルに係わる各拘束条件の重み)を、データ適用的に決定するアルゴリズムを考案する。時変メタパラメータの推定には、まず、状態空間モデルでよく利用するハイパーパラメータ(ここではメタパラメータに相当)に対する平滑(smoothness)拘束条件を採用し、その条件も含めて学習器全体を自己組織化状態空間モデルで表現する。この状態空間モデルに対して、パラメータベクトルの推定に最適化を適用する代わりに逐次データ同化手法を適用し、そのアンサンブルから最適化による推定とは異なる特性をもつパラメータベクトルを算出する方策を検討する。
気象・海洋シミュレーション分野において、逐次データ同化(あるいはデータ同化操作無し)で得られた状態ベクトルの系列(プロダクトと呼ばれる)と観測データのセットに対して線形回帰解析を行い、大規模なシミュレーション計算を経ずに予測値を構成する研究が注目を浴びている。特に、時刻t-1の状態ベクトルから時刻tの観測ベクトル内の一要素を予測する操作は、予測エミュレータと呼ばれる。我々は、予測エミュレータへのストリーム計算の適用を模索する。2年目以降は、このような非線形予測エミュレータの計算アルゴリズムの開発に取り組む。中野と斉藤は、Kitagawa非線形問題やLorenz96モデル問題等の非線形フィルタ問題に対して、アンサンブル変換カルマンフィルタおよび局所アンサンブル変換カルマンフィルタを適用し、状態ベクトルの推定精度と計算速度の2面から他フィルタとの比較検討を行なう。

次年度使用額が生じた理由

平成26年度後半にそれまでとりまとめた調査研究の内容を総括し発表する機会(チュートリアルセミナーの企画・実施)を得たので、予算を確保し計画していた海外での発表は次年度に回しても十分な研究進捗であると判断したため。

次年度使用額の使用計画

平成26年度に実施しなかった国際会議での発表費用および、今年度から本格的に始める非線形フィルタ問題の計算機上での数値実験作業の支援に必要な人件費にあてる。

  • 研究成果

    (15件)

すべて 2015 2014 その他

すべて 雑誌論文 (3件) (うち査読あり 2件) 学会発表 (10件) (うち招待講演 5件) 備考 (2件)

  • [雑誌論文] Estimation of temporal evolution of the helium plasmasphere based on a sequence of IMAGE/EUV images2014

    • 著者名/発表者名
      Shinya. Nakano, Mei.-Ching. Fok, Pontus. C. Brandt, Tomoyuki. Higuchi
    • 雑誌名

      Journalof Geophys Research

      巻: Vol.119 ページ: 3708-3723

    • DOI

      10.1002/2013JA019734

    • 査読あり
  • [雑誌論文] Estimation of the helium ion density distribution in the plasmasphere based on a single IMAGE/EUV image2014

    • 著者名/発表者名
      Shinya. Nakano, Mei.-Ching. Fok, Pontus. C. Brandt, Tomoyuki. Higuchi
    • 雑誌名

      Journalof Geophys Research

      巻: Vol.119 ページ: 3724-3740

    • DOI

      10.1002/2013JA019733

    • 査読あり
  • [雑誌論文] 地球科学におけるシミュレーションとビッグデータ-データ同化とエミュレーション2014

    • 著者名/発表者名
      中野慎也, 樋口知之
    • 雑誌名

      電子情報通信学会誌

      巻: Vol.97, No.10 ページ: 869-875

  • [学会発表] エミュレータ・デザインの基礎数理1:データ同化とスパース回帰2015

    • 著者名/発表者名
      樋口知之
    • 学会等名
      電子情報通信学会東京支部シンポジウム「実験計画、データ同化、そしてエミュレータ・デザインへ」
    • 発表場所
      機械振興会館(東京都港区)
    • 年月日
      2015-03-05 – 2015-03-05
  • [学会発表] 機能のモデル化と真理の探求のバランス感覚2014

    • 著者名/発表者名
      樋口知之
    • 学会等名
      科学研究補助金「新学術領域研究」スパースモデリングの深化と高次元データ駆動科学の創成 公開シンポジウム
    • 発表場所
      東京工業大学(神奈川県緑区)
    • 年月日
      2014-12-15 – 2014-12-15
    • 招待講演
  • [学会発表] ビッグデータ奔流が破壊する理系・文系の壁2014

    • 著者名/発表者名
      樋口知之
    • 学会等名
      2014年度同志社大学文化情報学研究科シンポジウム
    • 発表場所
      同志社大学(京都府京田辺市)
    • 年月日
      2014-11-29 – 2014-11-29
  • [学会発表] 賢く増やすと減らすはビッグデータ解析の基本2014

    • 著者名/発表者名
      樋口知之
    • 学会等名
      データサイエンティスト協会 1stシンポジウム~実務者が集うデータサイエンスの最前線~
    • 発表場所
      東京コンファレンスセンター・品川(東京都港区)
    • 年月日
      2014-11-27 – 2014-11-27
  • [学会発表] Stream computing and emulation in a world of the edge heavy data2014

    • 著者名/発表者名
      Tomoyuki. Higuchi
    • 学会等名
      International Conference for Mathematics, Statistics and Financial Mathematics (ICMSFM2014) with IASC-ARS Sessions
    • 発表場所
      Sunway Resort Hotel&Spa(Petaling Jaya, Selangor,Malaysia)
    • 年月日
      2014-11-18 – 2014-11-18
    • 招待講演
  • [学会発表] Big data and personalization technology: Imputation, Linkage, and Stream computing2014

    • 著者名/発表者名
      Tomoyuki. Higuchi
    • 学会等名
      東北大学知のフォーラム国際会議
    • 発表場所
      東北大学(宮城県仙台市)
    • 年月日
      2014-11-06 – 2014-11-06
    • 招待講演
  • [学会発表] データ同化技術を用いた投薬・治療の未来像2014

    • 著者名/発表者名
      樋口知之
    • 学会等名
      第18回関東ハートセミナー
    • 発表場所
      京王プラザホテル(東京都新宿区)
    • 年月日
      2014-09-12 – 2014-09-12
  • [学会発表] データ同化によるエミュレータ・デザイン学の創設2014

    • 著者名/発表者名
      樋口知之
    • 学会等名
      バイオスーパーコンピューティング東北2014
    • 発表場所
      東北大学流体科学研究所(宮城県仙台市)
    • 年月日
      2014-06-02 – 2014-06-02
  • [学会発表] 木を見て森も見るビッグデータ解析技術2014

    • 著者名/発表者名
      樋口知之
    • 学会等名
      第68回NHK技研公開2014
    • 発表場所
      NHK放送技術研究所(東京都世田谷区)
    • 年月日
      2014-05-29 – 2014-05-29
    • 招待講演
  • [学会発表] 同床異夢のビッグデータ2014

    • 著者名/発表者名
      樋口知之
    • 学会等名
      日経ビッグデータ創刊記念フォーラム
    • 発表場所
      日経ホール(東京都千代田区)
    • 年月日
      2014-04-22 – 2014-04-22
    • 招待講演
  • [備考] 樋口知之ホームページ

    • URL

      http://www.ism.ac.jp/~higuchi/

  • [備考] 統計数理研究所

    • URL

      http://www.ism.ac.jp/

URL: 

公開日: 2016-06-01  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi