研究課題/領域番号 |
25330040
|
研究機関 | 札幌学院大学 |
研究代表者 |
中村 永友 札幌学院大学, 経済学部, 教授 (70207900)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | 混合分布モデル / 欠損データ |
研究実績の概要 |
本研究は,人工衛星で観測される磁気圏プラズマ速度データの統合的な分析を行うための種々の問題解決が目的である.このデータの形式は「離散×不等間隔×方角データ×擬頻度×非対称分布×ノイズ的データの存在×欠損領域×複数成分×大規模×時系列」というこれまでの統計学が個々に扱ってきたデータ形式が混合した,非正規j・非典型データである.これらの各要素は正則化等の変換により従来の統計手法で分析することができるが,分析手法を単に組み合わせただけでは十分有意な情報抽出はできない.本研究はこれらの個々の問題解決を順次行い,時空間統合モデルを作り,最終目標は人工衛星搭載可能なソフトウェア開発である.
以上の目的の下で以下のことを行った.欠測データに対する統計的接近として,典型的なパラメトリックな統計的モデリングである値引ち切り(censored)や切断(truncated)を考慮した分析方法があるが,本年度は昨年度に引き続いて,ある特定の領域で分析上無視できない欠測データがあり,さらにその領域では正常に測定されたデータも存在している,という問題を扱った. このようなデータを分析するには,従来の値打ち切りや切断の統計モデルをそのまま適用できないため,このモデリングは一部の領域でランダムな欠測がある(partially missing at random)という視点でモデリングが可能であることを理論的に示した.さらに基礎となる確率分布を正規混合分布に拡張することを行い,さらに混合分布の成分数を推定するための検討を行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
授業とその準備,校務,研究のための時間のバランスがうまく調整ができず,研究時間を十分に採ることができなかった.
|
今後の研究の推進方策 |
今後の研究方針は,現在の研究成果を多次元(多変数)に拡張しつつ,パラメータ推定に関する安定性の研究,成分数の推定に関する理論構築とアルゴリズムの研究を同時に進めていく.以下に,様々な問題点を挙げておくが,互いに依存する事柄であり,より現実的な対応をしながら逐次解決をしていく.
さらに,次のようなデータに内在する「分析の困難さを常に考慮しながらモデル構築を進める.(1)データはプラズマが飛来する方向(角度)と径の長さを速度とする極座標形式で記録され,さらに極座標空間が多数のセルで、分割(離散化)され,セル内のプラズマの頻度が観測される.実際の分析対象のデータは物理的変換を伴うので,頻度のような実数(擬頻度)となる.(2)データ空間内に非ノイズデータが存在し,現実的かっ実用的な方法(モデリング,データ正則化)の判断が必要である.(3)成分分布数の推定において複雑かつ多変量の混合分布モデルではブートストラップ情報量規準EICが有効であるが,離散×擬頻度データに対してEICは有効でなく,この問題解決が必要である.(4)大規模な欠測データが存在し,なおかつ混合分布を想定しなければいけない. 次に系列的推移のモデリングの問題点として,(5)観測状況に応じて観測卒像度に違いがあること,(6)系列的データのモデノレ化の多様性(混合分布モデルの系列的パラメタ推定のそモデル化として確率過程,ベイズモデル等)があり,物理的解釈の容易性と実用化のバランスが必要となる.さらに,(7)出現・消失する成分分布のモデル化の困難さがある.これは「識別可能性の問題」などの困難な問題を伴うため,アルゴリズムによるアプローチで解決を図る.とくに厄介なのが大規模欠測処理のモデリングとその混合分布モデルとその成分数推定である.また離散擬頻度データに対する対数尤度のバイアス補正方法の確立とその漸近化も課題である.
|