独立成分分析は、互いに独立な原信号が線形に混合された値が観測されたときに、観測値からもとの独立な原信号を復元することを目的とする。研究代表者の南はこれまでに、観測値に外れ値がある場合やスパイクノイズが加わった場合などでも復元ができる頑健なBlind source separation方法をβダイバージェンスを基に提案した(最小βダイバージェンス法)。この方法は、βが大きいほど外れ値に強く頑健であるが、あまりに大きい場合は推定効率が悪くなる。そこで、個々のデータに対し、頑健であるがあまり推定効率が悪くならないようなβを適応的に選択する方法を提案し、典型的な外れ値が存在するデータへの有用性はすでに示した。 今年度は昨年提案した、Mixture ICAモデルに最小βダイバージェンス法を適用し、逐次的に各独立成分コンポートネントの復元行列を推定する方法について研究を進めた。Mixture ICAモデル(混合独立成分モデル)は中心の位置が異なるいくつかの独立成分モデルに従う標本が混じって観測されるときのモデルであり、例えば、種類の異なる画像が混じって得られる場合などに想定されるモデルである。このモデルに従うデータに対して最小βダイバージェンス法を用いると位置パラメータの初期値があるコンポーネントの位置に近ければ、そのコンポーネントに対する復元行列を推定することができる。これは、他のコンポーネントに属するデータポイントが外れ値とみなされて推定の際のウェイトが0に近くなるからである。また、同様にして局所的な潜在構造が複数存在する場合の主成分分析方法を提案した。これらの研究は総合研究大学院大学大学院生であったMd.Nurul Haque Mollah氏、統計数理研究所/総合研究大学院大学の江口真透教授との共同研究である。 さらに、近年提案されたnonnegative matrix factorization(NMF)について、Tweedie modelによる解釈を与え、理論的により整合性を持つ方法について研究を行った。これについて統計数理研究所の共同研究「独立成分分析に関する理論と応用」の研究会で発表を行った。
|