研究概要 |
人工衛星により観測されたプラズマ粒子速度データに対して混合分布モデルによる分析を行なった.このデータは基本的に,データ自身の問題と,モデル適用上の問題が存在する.まず前者は,(1)離散の値(極座標値)+実数値の重み(擬頻度)という形式のデータである,(2)高速と速度0付近の粒子が観測不能であるため分布が切断されている,(3)部分的にゆがんだ分布がある,(4)ノイズでない拡散粒子の存在,(5)データ数(粒子数)は数千から数万と大規模データセットであること,(6)データ形式が本来極座標形式の方角データ(directional data)であることなどが挙げられる.後者は,以上のデータの性質を受けて,成分分布の選定の問題,方角データを基礎とする分布(Fisher分布,Kent分布など)の混合やロバスト化・skew化,最も重要な成分分布数の推定問題,などが挙げられる.このデータ解析において従来手法をストレートに適用した結果が,すでに発行されている.しかし,より厳密な解析を行なう場合には様々な工夫が必要となってくる. 本年度は,これら多数の問題のうち,低速部分で観測される粒子の扱い,物理的解釈可能な速度成分の線形化変換の問題を扱い,現在も継続検討している.これまで統計科学であまり扱うことのなかったデータであるので,研究計画を提出した時点より様々な問題点やそれに対するアイディアがいくつも出はじめている.例えば仮定する混合分布モデルを進化させて,成分パラメタの時系列的扱い,およびベイズ的扱いが,より実際のデータ解析上有用ではないかと思いはじめている.近い将来この検討を進める予定である.
|