• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実施状況報告書

大規模欠測を伴う空間系列的超大量非典型データの統合的モデリング

研究課題

研究課題/領域番号 25330040
研究機関札幌学院大学

研究代表者

中村 永友  札幌学院大学, 経済学部, 教授 (70207900)

研究期間 (年度) 2013-04-01 – 2017-03-31
キーワード混合分布モデル / 欠損データ
研究実績の概要

本研究は,人工衛星で観測される磁気圏プラズマ速度データの統合的な分析を行うための種々の問題解決が目的である.このデータの形式は「離散×不等間隔×方角データ×擬頻度×非対称分布×ノイズ的データの存在×欠損領域×複数成分×大規模×時系列」というこれまでの統計学が個々に扱ってきたデータ形式が混合した,非正規j・非典型データである.これらの各要素は正則化等の変換により従来の統計手法で分析することができるが,分析手法を単に組み合わせただけでは十分有意な情報抽出はできない.本研究はこれらの個々の問題解決を順次行い,時空間統合モデルを作り,最終目標は人工衛星搭載可能なソフトウェア開発である.

以上の目的の下で以下のことを行った.欠測データに対する統計的接近として,典型的なパラメトリックな統計的モデリングである値引ち切り(censored)や切断(truncated)を考慮した分析方法があるが,本年度は昨年度に引き続いて,ある特定の領域で分析上無視できない欠測データがあり,さらにその領域では正常に測定されたデータも存在している,という問題を扱った.
このようなデータを分析するには,従来の値打ち切りや切断の統計モデルをそのまま適用できないため,このモデリングは一部の領域でランダムな欠測がある(partially missing at random)という視点でモデリングが可能であることを理論的に示した.さらに基礎となる確率分布を正規混合分布に拡張することを行い,さらに混合分布の成分数を推定するための検討を行った.

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

授業とその準備,校務,研究のための時間のバランスがうまく調整ができず,研究時間を十分に採ることができなかった.

今後の研究の推進方策

今後の研究方針は,現在の研究成果を多次元(多変数)に拡張しつつ,パラメータ推定に関する安定性の研究,成分数の推定に関する理論構築とアルゴリズムの研究を同時に進めていく.以下に,様々な問題点を挙げておくが,互いに依存する事柄であり,より現実的な対応をしながら逐次解決をしていく.

さらに,次のようなデータに内在する「分析の困難さを常に考慮しながらモデル構築を進める.(1)データはプラズマが飛来する方向(角度)と径の長さを速度とする極座標形式で記録され,さらに極座標空間が多数のセルで、分割(離散化)され,セル内のプラズマの頻度が観測される.実際の分析対象のデータは物理的変換を伴うので,頻度のような実数(擬頻度)となる.(2)データ空間内に非ノイズデータが存在し,現実的かっ実用的な方法(モデリング,データ正則化)の判断が必要である.(3)成分分布数の推定において複雑かつ多変量の混合分布モデルではブートストラップ情報量規準EICが有効であるが,離散×擬頻度データに対してEICは有効でなく,この問題解決が必要である.(4)大規模な欠測データが存在し,なおかつ混合分布を想定しなければいけない.
次に系列的推移のモデリングの問題点として,(5)観測状況に応じて観測卒像度に違いがあること,(6)系列的データのモデノレ化の多様性(混合分布モデルの系列的パラメタ推定のそモデル化として確率過程,ベイズモデル等)があり,物理的解釈の容易性と実用化のバランスが必要となる.さらに,(7)出現・消失する成分分布のモデル化の困難さがある.これは「識別可能性の問題」などの困難な問題を伴うため,アルゴリズムによるアプローチで解決を図る.とくに厄介なのが大規模欠測処理のモデリングとその混合分布モデルとその成分数推定である.また離散擬頻度データに対する対数尤度のバイアス補正方法の確立とその漸近化も課題である.

  • 研究成果

    (8件)

すべて 2015 2014

すべて 雑誌論文 (3件) (うち査読あり 2件、 謝辞記載あり 3件、 オープンアクセス 2件) 学会発表 (5件)

  • [雑誌論文] Pseudo-normal random number generation via the Eulerian numbers2015

    • 著者名/発表者名
      Nagatomo NAKAMURA
    • 雑誌名

      Josai Mathematical Monographs

      巻: 8 ページ: 85-95

    • 査読あり / 謝辞記載あり
  • [雑誌論文] ロジスティック回帰による課題提出ログデータの解析2015

    • 著者名/発表者名
      中村永友・石川千温・渡辺慎哉・小池英勝
    • 雑誌名

      札幌学院大学 総合研究所紀要 (情報科学)

      巻: 2 ページ: 1-6

    • オープンアクセス / 謝辞記載あり
  • [雑誌論文] 層別された平均系列データに対する線形回帰モデル(A linear regression model for stratified data)2014

    • 著者名/発表者名
      土屋高宏・中村永友
    • 雑誌名

      行動計量学

      巻: 41 ページ: 3-15

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [学会発表] 関数データクラスタリングにおける部分区間の同定法と学習ログデータへの適用2015

    • 著者名/発表者名
      松井祐介・島村徹平・水田正弘・中村永友,
    • 学会等名
      日本分類学会, 第33回大会
    • 発表場所
      帝京大学, 東京
    • 年月日
      2015-03-02 – 2015-03-03
  • [学会発表] Pseudo-normal random number generation via the Eulerian numbers2014

    • 著者名/発表者名
      中村永友
    • 学会等名
      城西大学理学研究科数学専攻ワークショップ「統計科学とその周辺」
    • 発表場所
      城西大学, 東京
    • 年月日
      2014-12-07
  • [学会発表] 潜在変数を含む統計モデルにおけるブートストラップ分散減少法2014

    • 著者名/発表者名
      中村永友・土屋高宏・小西貞則
    • 学会等名
      2014年度統計関連学会連合大会 (日本統計学会第83回大会, 応用統計学会年次大会, 日本計量生物学会年次大会)
    • 発表場所
      東京大学, 東京
    • 年月日
      2014-09-14 – 2014-09-16
  • [学会発表] ソーティング過程に現れる離散確率分布とその精密化2014

    • 著者名/発表者名
      土屋高宏・中村永友
    • 学会等名
      2014年度統計関連学会連合大会 (日本統計学会第83回大会, 応用統計学会年次大会, 日本計量生物学会年次大会)
    • 発表場所
      東京大学, 東京
    • 年月日
      2014-09-14 – 2014-09-16
  • [学会発表] 課題完成時間からの習熟度別分布の推定2014

    • 著者名/発表者名
      中村永友,石川千温,渡辺慎哉
    • 学会等名
      2014PCカンファレンス,CIEC(コンピュータ利用教育学会)研究大会
    • 発表場所
      札幌学院大学,北海道江別市
    • 年月日
      2014-08-08 – 2014-08-10

URL: 

公開日: 2016-05-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi