研究概要 |
人工衛星により観測されたプラズマ粒子速度データに対して混合分布モデルによる分析を行なった.このデータは基本的に,データ自身の問題と,モデル適用上の問題が存在する.まず前者は,(1)離散の値(極座標値)+実数値の重み(擬頻度)という形式のデータである,(2)高速と速度0付近の粒子が観測不能であるため分布が切断されている,また計測器が仰角俯角方向±75の範囲でしか計測できないため,上下方向も観測不能である,(3)部分的にゆがんだ分布がある,(4)ノイズでない拡散粒子の存在,(5)データ数(粒子数)は数千から数万と大規模データセットであること,(6)データ形式が本来極座標形式の方角データ(directional data)であることなどが挙げられる.後者は,以上のデータの性質を受けて,成分分布の選定の問題,方角データを基礎とする分布(Fisher分布,Kent分布など)の混合やロバスト化・skew化,最も重要な成分分布数の推定問題,などが挙げられる.このデータ解析において従来手法をストレートに適用した結果が,すでに発行されている.しかし,より厳密な解析を行なう場合には様々な工夫が必要となってくる. 本年度は,これら多数の問題のうち,(2)の観測不能領域に対する検討を行った.まず,1次元の正規分布において観測不能領域を含むモデリングをして正確なパラメタ推定を行うための方法を提案した.このモデルを混合分布モデルに拡張し,同様に各パラメタの正確な推定を実現した.現在は,この1次元のモデルを多次元に拡張し実データヘ適用を行っているところである. これまで統計科学であまり扱うことのなかったデータであるので,研究計画を提出した時点より様々な問題点やそれに対するアイディアがいくつも出はじめている.例えば仮定する混合分布モデルを進化させて,成分パラメタの時系列的扱い,およびベイズ的扱いが,より実際のデータ解析上有用ではないかと思いはじめている.近い将来この検討を進め予定である.
|