• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実施状況報告書

大規模欠測を伴う空間系列的超大量非典型データの統合的モデリング

研究課題

研究課題/領域番号 25330040
研究種目

基盤研究(C)

研究機関札幌学院大学

研究代表者

中村 永友  札幌学院大学, 経済学部, 教授 (70207900)

研究期間 (年度) 2013-04-01 – 2017-03-31
キーワード欠測データ / 部分的MAR / 混合分布モデル
研究概要

本研究は,人工衛星で観測される磁気圏プラズマ速度データの統合的な分析を行うための種々の問題解決が目的である.このデータの形式は「離散×不等間隔×方角データ×擬頻度×非対称分布×ノイズ的データの存在×欠損領域×複数成分×大規模×時系列」というこれまでの統計学が個々に扱ってきたデータ形式が混合した,非正則・非典型データである.これらの各要素は正則化等の変換により従来の統計手法で分析することができるが,分析手法を単に組み合わせただけでは十分有意な情報抽出はできない.本研究はこれらの個々の問題解決を順次行い,時空間統合モデルを作り,究極的には人工衛星搭載可能なソフトウェア開発を行う.
以上の目的の下で以下のことを行った.欠測データに対する統計的接近として,典型的なパラメトリックな統計的モデリングである値打ち切り(censored)や切断(truncated)を考慮した分析方法があるが,本年度はある特定の領域で分析上無視できない欠測データがあり,さらにその領域では正常に測定されたデータも存在している,という問題を扱った.例えば機器の調子が悪く,ある特定の測定範囲で記録されたデータもあれば,うまく記録されなかったデータもあるという状況である.これは部分的に一部の領域でランダムな欠測がある(partially missing at random)という視点でモデリングが可能である.このようなデータを分析するには,従来の値打ち切りや切断の統計モデルをそのまま適用できない.そこで,このような問題に対する統計モデルを示し,さらに基礎となる確率分布を正規混合分布に拡張することを行った.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

授業とその準備,校務,研究のための時間がほぼうまく調整ができ,研究時間に対してある程度割くことができた.

今後の研究の推進方策

今後の研究方針は,主として現在の研究成果を多次元(多変数)に拡張し,パラメータ推定に関する安定性の研究を同時に進めていく.
さらに,次に示すデータに内在する「分析の困難さ」を常に考慮しながらモデル構築する.(1)データはプラズマが飛来する方向(角度)と径の長さを速度とする極座標形式で記録され,さらに極座標空間が多数のセルで分割(離散化)され,セル内のプラズマの頻度が観測される.分析する際には物理的変換を伴うので,頻度のような実数(擬頻度)となる.(2)データ空間内に非ノイズデータが存在し,現実的かつ実用的な方法(モデリング,データ正則化)の判断が必要である.(3)成分分布数の推定において複雑かつ多変量の混合分布モデルではブートストラップ情報量規準EICが有効であるが,離散×擬頻度データに対してEICは有効でないので,この問題解決が必要である.(4)大規模な欠測データが存在し,なおかつ混合分布を想定しなければいけないこと.次に系列的推移のモデリングの問題点として,(5)観測状況に応じて観測解像度に違いがあること,(6)系列的データのモデル化の多様性(混合分布モデルの系列的パラメタ推定のモデル化として確率過程,ベイズモデル等)があり,物理的解釈の容易性と実用化のバランスが必要となる.さらに,(7)出現・消失する成分分布のモデル化の困難さがある.これは「識別可能性の問題」などの困難な問題を伴うため,アルゴリズムによるアプローチで解決を図る.とくに厄介なのが大規模欠測処理のモデリングとその混合分布モデルとその成分数推定である.また離散擬頻度データに対する対数尤度のバイアス補正方法の確立とその漸近化も課題である.

次年度の研究費の使用計画

大学全体の仕事を行う役職に就いたことで,当初の予定通り出張ができなかったこと,人件費費謝金を使う必要がなかったことが挙げられる.
次年度への繰り越しは10000円未満なので,特段の計画はない.

  • 研究成果

    (4件)

すべて 2014 2013

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (2件)

  • [雑誌論文] 層別された平均系列データに対する線形回帰モデル(A linear regression model for stratified data)2014

    • 著者名/発表者名
      土屋高宏, 中村永友
    • 雑誌名

      行動計量学

      巻: 40 ページ: 101-111

    • 査読あり
  • [雑誌論文] Iterative algorithm for maximum likelihood estimation of observation error covariance matrix for ensemble-based filters2014

    • 著者名/発表者名
      Genta UENO and Nagatomo NAKAMURA
    • 雑誌名

      Qurterly Journal of the Royal Meteorological Society

      巻: 140 ページ: 295-315

    • DOI

      DOI:10.1080/02664763.2013.772570

    • 査読あり
  • [学会発表] 一部の観測領域でランダムな欠測のあるデータへの混合分布モデルの適用2013

    • 著者名/発表者名
      中村永友・土屋高宏・上野玄太
    • 学会等名
      科研費シンポジウム, 『一般化線形モデルの最新の展開とその周辺』, (科学研究費・基盤(A)によるシンポジウム, 研究代表者:谷口正信, 「非対称・非線形統計理論と経済・生体科学への応用」, 課題番号:23244011)
    • 発表場所
      千葉大学, 千葉市
    • 年月日
      20131108-20131110
  • [学会発表] 一部の観測領域でランダムな欠測のあるデータに対する混合分布モデルのあてはめ2013

    • 著者名/発表者名
      中村永友・土屋高宏・上野玄太
    • 学会等名
      2013年度統計関連学会連合大会 (日本統計学会第82回大会, 応用統計学会年次大会, 日本計量生物学会年次大会)
    • 発表場所
      大阪大学, 豊中市
    • 年月日
      20130908-20130911

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi