研究課題/領域番号 |
26280010
|
研究機関 | 統計数理研究所 |
研究代表者 |
樋口 知之 統計数理研究所, その他部局等, 所長 (70202273)
|
研究分担者 |
中野 慎也 統計数理研究所, モデリング研究系, 助教 (40378576)
有吉 雄哉 統計数理研究所, データ同化研究開発センター, 特任研究員 (80735019)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 時系列解析 / 逐次データ同化 |
研究実績の概要 |
ビッグデータは、ECサイトやソーシャルメディアのようなクラウド上だけでなく、むしろエッジと呼ぶべき、インターネットの終端である計測・観測の現場で大量生産されている。それらをそのままクラウドへ輸送することは、その輸送コストおよび帯域量の観点から現実的でなく、その場で目的に応じたオンライン計算が必須である。その目的のために、機械学習分野ではストリーム計算と呼ばれる研究分野が大きな注目を浴びている一方、大規模な次元の観測ベクトルデータの処理に関しては気象・海況予報分野において逐次データ同化手法の研究がこの20年間継続的になされてきた。本研究では、この異なる特性をもつフィルタリング機能の両者の優れた点を利用した手法の開発を目標とする。 3年研究計画の課題の中間年にあたる本年度は、逐次データ同化手法のストリーム計算への適用可能性を探った。特に、ストリーム計算でアドホックに定めていたメタパラメータ(パラメータベクトルに係わる各拘束条件の重み)を、データ適用的に決定する方策ついて検討した。具体的には、時変メタパラメータの推定に状態空間モデルでよく利用する、ハイパーパラメータ(ここではメタパラメータに相当)に対する平滑(smoothness)拘束条件を採用する。その拘束条件も含めて学習器全体を自己組織化状態空間モデルで表現し、この状態空間モデルに対して逐次データ同化手法を適用した。逐次データ同化のアンサンブルから、最適化による推定とは異なる特性をもつパラメータベクトルを算出するアルゴリズムを開発した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度はマスメディア等により、一般の方々も含めて人工知能への興味と期待が大きくふくれあがった年であった。特に産業界においては、IoT(Internet of Things)の潜在的能力の本格的利用には人工知能が欠かせないという理解のもとに、人工知能の基礎技術である機械学習への注目度がこれまで以上に大きくなっている。IoTと機械学習技術の接点となる重要な要素技術は、本研究課題の主題でもあるストリーム計算と断言しても間違いない。産業界でもその認識を共有する方々が徐々にではあるが増えてきており、そのため本研究課題の狙いと方向性について、その紹介依頼が産業界を中心に多方面から本年度はかなり増えた。この点から、少なくともメニューAおよびBの方法論の観点からの研究進捗は、一定の評価を得られたと考えている。その一方で、Bメニューの具体的な数値実験の評価作業については、計算速度の観点からの検討がまだ不十分であり、そのため論文等の発表にまでには至らなかった。従って、総合的観点から研究はおおむね順調に進展していると判断した。
|
今後の研究の推進方策 |
最終年度では、二つの研究軸(AメニューとBメニュー)各々でまとめの作業に注力する。Aメニューは、逐次データ同化手法のストリーム計算への適用可能性を探るものであり、逆にBメニューはストリーム計算で利用される最適化技法の逐次データ同化手法への適用を模索するものである。Aメニューでの研究内容として、x_t を時刻t の入力画像データ、y_t をあるイメージ(例えば、映像内の不審者の有無)、またw_t をその判別器に含まれるパラメータとする時変判別問題に対して、前年度開発したアンサンブルベースの非線形フィルタの適用を試みる。アンサンブルの諸特徴量を用いた、異なるw_t の推定法の性能評価を、各々の判別結果およびストリーム計算の判別結果と比較する数値実験を行なう。Bメニューでは、比較的低次元の状態空間モデルを用いた双子実験により、提案する非線形予測エミュレータの性能を考察する。双子実験とは既知のシミュレーションモデルから生成したデータに、性質が既知の観測ノイズを加えて作成した観測データから、データ同化を用いて状態ベクトルやパラメータの推定を行ない、どの程度真の値が復元されるかを調べる実験である。利用するモデルとしては、Kitagawa 非線形問題、Lorenz96 モデルおよびマウス概日周期モデルを想定している。これまで開発してきた非線形フィルタのソースを非線形フィルタへの適用事例を示すグラフとともに整理し、論文や国際会議等での発表情報とあわせてホームページでの情報公開に努める。あわせて、前年度開発した逐次フィルタリング手法の応用成果を示す可視化ソフトの改良も継続する。
|
次年度使用額が生じた理由 |
国内外での研究への注目度の高まりにより招待講演依頼が多数寄せられ、それに注力したことで、研究成果の効果的発表は十分に実現できた一方で、特に海外での研究成果発表用に確保していた旅費を中心に予算に余裕ができたため。期待をしていた最新型のGPU搭載の高性能計算機の開発・販売が遅れ、総合的観点から、安定した稼働が見込まれる標準的な計算機の購入に変更したため。
|
次年度使用額の使用計画 |
平成27年度に評価がまだ十分とは言えないと自己判断したBメニューの数値実験の支援に必要な人件費、および最終年度であるため、逐次フィルタリング手法の応用成果を示す可視化ソフトの一層の改善に必要なソフト開発費にあてる。
|