研究課題/領域番号 |
16500184
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
統計科学
|
研究機関 | 統計数理研究所 |
研究代表者 |
南 美穂子 統計数理研究所, 数理・推論研究系, 助教授 (70277268)
|
研究期間 (年度) |
2004 – 2006
|
研究課題ステータス |
完了 (2006年度)
|
配分額 *注記 |
1,900千円 (直接経費: 1,900千円)
2006年度: 800千円 (直接経費: 800千円)
2005年度: 600千円 (直接経費: 600千円)
2004年度: 500千円 (直接経費: 500千円)
|
キーワード | ICA / BSS / βダイバージェンス / 頑健性 / 外れ値 / NMF / Tweedie models / PCA / Tweedie分布 / 特異値分解 / 一般化線型モデル / β-ダイバージェンス / Mixture models |
研究概要 |
独立成分分析は、互いに独立な原信号が線形に混合された値が観測されたときに、観測値からもとの独立な原信号を復元することを目的とする。研究代表者の南はこれまでに観測値に外れ値がある場合やスパイクノイズが加わった場合などでも復元ができる頑健なBlind source separation方法をβダイバージェンスを基に提案した(最小βダイバージェンス法)。この方法は、βが大きいほど外れ値に強く頑健であるが、あまりに大きい場合は推定効率が悪くなる。そこで、個々のデータに対し、頑健であるがあまり推定効率が悪くならないようなβを適応的に選択する方法を提案し外れ値が存在するデータへの有用性を示した。 外れ値に頑健であるという最小βダイバージェンス法の特性を積極的に活かしたのが、独立成分構造や主成分構造が空間内に複数存在するときに逐次的に各独立成分コンポートネントの復元や各主成分構造の推定をするという研究である。また独立成分分析の前処理としてよく行われる球状化を最小βダイバージェンス法によってより頑健に行うという研究も行った。これらは総合研究大学院大学大学院生であったMd.Nurul Haque Mollah氏、統計数理研究所/総合研究大学院大学の江口真透教授との共同研究で行った。 近年、観測値が非負であるような多変量データを要素が非負の行列の積として表現するnonnegative matrix factorization(NMF)が理論面・応用面で関心を集めており、様々なダイバージェンスを元にした方法が提案されている。これらにTweedie分布による解釈を与え、更にこれまでに暗に想定されていた正規誤差やボアソン誤差という仮定を一般化線型モデルに似た枠組みで一般化した方法を提案し、多変量漁獲・混獲データの特徴量抽出に適用した。
|