• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Annual Research Report

エッジヘビィデータ環境下におけるストリーミング計算用非線形フィルタ手法の研究

Research Project

Project/Area Number 26280010
Research InstitutionThe Institute of Statistical Mathematics

Principal Investigator

樋口 知之  統計数理研究所, その他部局等, 所長 (70202273)

Co-Investigator(Kenkyū-buntansha) 中野 慎也  統計数理研究所, 大学共同利用機関等の部局等, 助教 (40378576)
齋藤 正也  東京大学, 医学系研究科, 特任助教 (00470047) [Withdrawn]
有吉 雄哉  統計数理研究所, 大学共同利用機関等の部局等, 特任研究員 (80735019)
Project Period (FY) 2014-04-01 – 2017-03-31
Keywords時系列解析 / 逐次データ同化
Outline of Annual Research Achievements

ビッグデータは、ECサイトやソーシャルメディアのようなクラウド上だけでなく、むしろエッジと呼ぶべき、インターネットの終端である計測・観測の現場で大量生産されている。それらをそのままクラウドへ輸送することは、その輸送コストおよび帯域量の観点から現実的でなく、その場で目的に応じたオンライン計算が必須である。その目的のために、機械学習分野ではストリーム計算と呼ばれる研究分野が大きな注目を浴びている一方、大規模な次元の観測ベクトルデータの処理に関しては気象・海況予報分野において逐次データ同化手法の研究がこの20年間継続的になされてきた。本研究では、この異なる特性をもつフィルタリング機能の両者の優れた点を利用した手法の開発を目標とする。
初年度は既存手法の調査と整理にあてた。樋口は機械学習分野のストリーム計算の最新動向を調べた。特に、問題のタイプ(判別問題、回帰問題、…)、入力データの次元、出力データのタイプ、パラメータベクトルの次元、判別関数や回帰モデル等の出力データ表現の種類、学習器内の最適化法、細かい数値技術など、複数項目の観点から整理した手法の分類を行なった。機械学習コミュニティで研究されてきたFOBOSやRDAへの考察はもちろん、Fused Lassoのようなオフラインタイプの最適化問題の便宜的な簡易解法の調査も行なった。中野はデータ同化研究開発センターの我々以外のメンバーとも連携して、逐次データ同化手法、特にアンサンブルベースの逐次フィルタ研究の最前線を調査した。斉藤は中野と協力して、アンサンブル変換カルマンフィルタおよび局所アンサンブル変換カルマンフィルタのコンピュータ上への実装を開始した。各メンバーの調査結果をとりまとめ招待レビュー記事として発表を行なった。さらには、樋口、中野、齋藤の三人で、学会でのチュートリアルセミナーも企画および実施した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

初年度は調査研究が主であった。従って、調査の結果を何らかの形で研究者コミュニティに還元することは、確実な一つの研究成果と考えられる。研究テーマを想起した時の予想通り、ビッグデータ分析法におけるストリーム計算の研究はますます盛んとなり、それらとの関連性の高いエミュレーション研究についても、少しずつではあるがその重要性の認識は高まりつつある。その大きなうねりのなかで、本研究テーマの研究参加者が、調査研究の内容を整理し全体像を俯瞰する形でチュートリアルセミナーを企画できたことは、初年度の研究目的の内容から鑑みると、十分に目的は達成できたと考えられる。また、逐次データ同化手法の今後の方向性を調査した結果は、論文の前書き等にも情報として入れることができ、さらに複数の論文発表にまで至った点は高く自己評価できる。また、多数の国内外の国際会議やワークショップで、本研究テーマに関連した研究内容に関するレビュー的招待講演を行ったことは、本研究テーマが研究者コミュニティから注目されていることの証左である。ただし、非線形フィルタの計算機への実装については、参加者間で充分な議論の時間がとれたとまでは言えず、やや不満が残った。従って総合的観点から研究はおおむね順調に進展していると判断した。

Strategy for Future Research Activity

2年度目は、逐次データ同化手法のストリーム計算への適用可能性を探ることに注力する。特に、ストリーム計算でアドホックに定めていたメタパラメータ(パラメータベクトルに係わる各拘束条件の重み)を、データ適用的に決定するアルゴリズムを考案する。時変メタパラメータの推定には、まず、状態空間モデルでよく利用するハイパーパラメータ(ここではメタパラメータに相当)に対する平滑(smoothness)拘束条件を採用し、その条件も含めて学習器全体を自己組織化状態空間モデルで表現する。この状態空間モデルに対して、パラメータベクトルの推定に最適化を適用する代わりに逐次データ同化手法を適用し、そのアンサンブルから最適化による推定とは異なる特性をもつパラメータベクトルを算出する方策を検討する。
気象・海洋シミュレーション分野において、逐次データ同化(あるいはデータ同化操作無し)で得られた状態ベクトルの系列(プロダクトと呼ばれる)と観測データのセットに対して線形回帰解析を行い、大規模なシミュレーション計算を経ずに予測値を構成する研究が注目を浴びている。特に、時刻t-1の状態ベクトルから時刻tの観測ベクトル内の一要素を予測する操作は、予測エミュレータと呼ばれる。我々は、予測エミュレータへのストリーム計算の適用を模索する。2年目以降は、このような非線形予測エミュレータの計算アルゴリズムの開発に取り組む。中野と斉藤は、Kitagawa非線形問題やLorenz96モデル問題等の非線形フィルタ問題に対して、アンサンブル変換カルマンフィルタおよび局所アンサンブル変換カルマンフィルタを適用し、状態ベクトルの推定精度と計算速度の2面から他フィルタとの比較検討を行なう。

Causes of Carryover

平成26年度後半にそれまでとりまとめた調査研究の内容を総括し発表する機会(チュートリアルセミナーの企画・実施)を得たので、予算を確保し計画していた海外での発表は次年度に回しても十分な研究進捗であると判断したため。

Expenditure Plan for Carryover Budget

平成26年度に実施しなかった国際会議での発表費用および、今年度から本格的に始める非線形フィルタ問題の計算機上での数値実験作業の支援に必要な人件費にあてる。

  • Research Products

    (15 results)

All 2015 2014 Other

All Journal Article (3 results) (of which Peer Reviewed: 2 results) Presentation (10 results) (of which Invited: 5 results) Remarks (2 results)

  • [Journal Article] Estimation of temporal evolution of the helium plasmasphere based on a sequence of IMAGE/EUV images2014

    • Author(s)
      Shinya. Nakano, Mei.-Ching. Fok, Pontus. C. Brandt, Tomoyuki. Higuchi
    • Journal Title

      Journalof Geophys Research

      Volume: Vol.119 Pages: 3708-3723

    • DOI

      10.1002/2013JA019734

    • Peer Reviewed
  • [Journal Article] Estimation of the helium ion density distribution in the plasmasphere based on a single IMAGE/EUV image2014

    • Author(s)
      Shinya. Nakano, Mei.-Ching. Fok, Pontus. C. Brandt, Tomoyuki. Higuchi
    • Journal Title

      Journalof Geophys Research

      Volume: Vol.119 Pages: 3724-3740

    • DOI

      10.1002/2013JA019733

    • Peer Reviewed
  • [Journal Article] 地球科学におけるシミュレーションとビッグデータ-データ同化とエミュレーション2014

    • Author(s)
      中野慎也, 樋口知之
    • Journal Title

      電子情報通信学会誌

      Volume: Vol.97, No.10 Pages: 869-875

  • [Presentation] エミュレータ・デザインの基礎数理1:データ同化とスパース回帰2015

    • Author(s)
      樋口知之
    • Organizer
      電子情報通信学会東京支部シンポジウム「実験計画、データ同化、そしてエミュレータ・デザインへ」
    • Place of Presentation
      機械振興会館(東京都港区)
    • Year and Date
      2015-03-05 – 2015-03-05
  • [Presentation] 機能のモデル化と真理の探求のバランス感覚2014

    • Author(s)
      樋口知之
    • Organizer
      科学研究補助金「新学術領域研究」スパースモデリングの深化と高次元データ駆動科学の創成 公開シンポジウム
    • Place of Presentation
      東京工業大学(神奈川県緑区)
    • Year and Date
      2014-12-15 – 2014-12-15
    • Invited
  • [Presentation] ビッグデータ奔流が破壊する理系・文系の壁2014

    • Author(s)
      樋口知之
    • Organizer
      2014年度同志社大学文化情報学研究科シンポジウム
    • Place of Presentation
      同志社大学(京都府京田辺市)
    • Year and Date
      2014-11-29 – 2014-11-29
  • [Presentation] 賢く増やすと減らすはビッグデータ解析の基本2014

    • Author(s)
      樋口知之
    • Organizer
      データサイエンティスト協会 1stシンポジウム~実務者が集うデータサイエンスの最前線~
    • Place of Presentation
      東京コンファレンスセンター・品川(東京都港区)
    • Year and Date
      2014-11-27 – 2014-11-27
  • [Presentation] Stream computing and emulation in a world of the edge heavy data2014

    • Author(s)
      Tomoyuki. Higuchi
    • Organizer
      International Conference for Mathematics, Statistics and Financial Mathematics (ICMSFM2014) with IASC-ARS Sessions
    • Place of Presentation
      Sunway Resort Hotel&Spa(Petaling Jaya, Selangor,Malaysia)
    • Year and Date
      2014-11-18 – 2014-11-18
    • Invited
  • [Presentation] Big data and personalization technology: Imputation, Linkage, and Stream computing2014

    • Author(s)
      Tomoyuki. Higuchi
    • Organizer
      東北大学知のフォーラム国際会議
    • Place of Presentation
      東北大学(宮城県仙台市)
    • Year and Date
      2014-11-06 – 2014-11-06
    • Invited
  • [Presentation] データ同化技術を用いた投薬・治療の未来像2014

    • Author(s)
      樋口知之
    • Organizer
      第18回関東ハートセミナー
    • Place of Presentation
      京王プラザホテル(東京都新宿区)
    • Year and Date
      2014-09-12 – 2014-09-12
  • [Presentation] データ同化によるエミュレータ・デザイン学の創設2014

    • Author(s)
      樋口知之
    • Organizer
      バイオスーパーコンピューティング東北2014
    • Place of Presentation
      東北大学流体科学研究所(宮城県仙台市)
    • Year and Date
      2014-06-02 – 2014-06-02
  • [Presentation] 木を見て森も見るビッグデータ解析技術2014

    • Author(s)
      樋口知之
    • Organizer
      第68回NHK技研公開2014
    • Place of Presentation
      NHK放送技術研究所(東京都世田谷区)
    • Year and Date
      2014-05-29 – 2014-05-29
    • Invited
  • [Presentation] 同床異夢のビッグデータ2014

    • Author(s)
      樋口知之
    • Organizer
      日経ビッグデータ創刊記念フォーラム
    • Place of Presentation
      日経ホール(東京都千代田区)
    • Year and Date
      2014-04-22 – 2014-04-22
    • Invited
  • [Remarks] 樋口知之ホームページ

    • URL

      http://www.ism.ac.jp/~higuchi/

  • [Remarks] 統計数理研究所

    • URL

      http://www.ism.ac.jp/

URL: 

Published: 2016-06-01  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi