研究課題/領域番号 |
25330040
|
研究種目 |
基盤研究(C)
|
研究機関 | 札幌学院大学 |
研究代表者 |
中村 永友 札幌学院大学, 経済学部, 教授 (70207900)
|
研究期間 (年度) |
2013-04-01 – 2017-03-31
|
キーワード | 欠測データ / 部分的MAR / 混合分布モデル |
研究概要 |
本研究は,人工衛星で観測される磁気圏プラズマ速度データの統合的な分析を行うための種々の問題解決が目的である.このデータの形式は「離散×不等間隔×方角データ×擬頻度×非対称分布×ノイズ的データの存在×欠損領域×複数成分×大規模×時系列」というこれまでの統計学が個々に扱ってきたデータ形式が混合した,非正則・非典型データである.これらの各要素は正則化等の変換により従来の統計手法で分析することができるが,分析手法を単に組み合わせただけでは十分有意な情報抽出はできない.本研究はこれらの個々の問題解決を順次行い,時空間統合モデルを作り,究極的には人工衛星搭載可能なソフトウェア開発を行う. 以上の目的の下で以下のことを行った.欠測データに対する統計的接近として,典型的なパラメトリックな統計的モデリングである値打ち切り(censored)や切断(truncated)を考慮した分析方法があるが,本年度はある特定の領域で分析上無視できない欠測データがあり,さらにその領域では正常に測定されたデータも存在している,という問題を扱った.例えば機器の調子が悪く,ある特定の測定範囲で記録されたデータもあれば,うまく記録されなかったデータもあるという状況である.これは部分的に一部の領域でランダムな欠測がある(partially missing at random)という視点でモデリングが可能である.このようなデータを分析するには,従来の値打ち切りや切断の統計モデルをそのまま適用できない.そこで,このような問題に対する統計モデルを示し,さらに基礎となる確率分布を正規混合分布に拡張することを行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
授業とその準備,校務,研究のための時間がほぼうまく調整ができ,研究時間に対してある程度割くことができた.
|
今後の研究の推進方策 |
今後の研究方針は,主として現在の研究成果を多次元(多変数)に拡張し,パラメータ推定に関する安定性の研究を同時に進めていく. さらに,次に示すデータに内在する「分析の困難さ」を常に考慮しながらモデル構築する.(1)データはプラズマが飛来する方向(角度)と径の長さを速度とする極座標形式で記録され,さらに極座標空間が多数のセルで分割(離散化)され,セル内のプラズマの頻度が観測される.分析する際には物理的変換を伴うので,頻度のような実数(擬頻度)となる.(2)データ空間内に非ノイズデータが存在し,現実的かつ実用的な方法(モデリング,データ正則化)の判断が必要である.(3)成分分布数の推定において複雑かつ多変量の混合分布モデルではブートストラップ情報量規準EICが有効であるが,離散×擬頻度データに対してEICは有効でないので,この問題解決が必要である.(4)大規模な欠測データが存在し,なおかつ混合分布を想定しなければいけないこと.次に系列的推移のモデリングの問題点として,(5)観測状況に応じて観測解像度に違いがあること,(6)系列的データのモデル化の多様性(混合分布モデルの系列的パラメタ推定のモデル化として確率過程,ベイズモデル等)があり,物理的解釈の容易性と実用化のバランスが必要となる.さらに,(7)出現・消失する成分分布のモデル化の困難さがある.これは「識別可能性の問題」などの困難な問題を伴うため,アルゴリズムによるアプローチで解決を図る.とくに厄介なのが大規模欠測処理のモデリングとその混合分布モデルとその成分数推定である.また離散擬頻度データに対する対数尤度のバイアス補正方法の確立とその漸近化も課題である.
|
次年度の研究費の使用計画 |
大学全体の仕事を行う役職に就いたことで,当初の予定通り出張ができなかったこと,人件費費謝金を使う必要がなかったことが挙げられる. 次年度への繰り越しは10000円未満なので,特段の計画はない.
|