研究実績の概要 |
時間もしくは空間に依存する多変量関数データに対してクラスター分析を行う際、個体のクラスタリングとクラスターに関連する特徴抽出を同時に行うことで、クラスタリングの精度および解釈可能性の向上が見込まれる。多変量関数データのクラスタリングと特徴抽出の同時分析を実現する方法として、FPCK法(Yamamoto, 2012, ADAC)がすでに提案されている。しかし、FPCK法がうまく機能するためにはデータに特定の構造を仮定する必要があり、その仮定が崩れた場合にクラスタリングの精度が悪くなる。そこで、FPCK法の欠点を補うための方法として、FFKM法を開発し、理論および数値実験の両面から確かにFPCK法と相補的な関係にあることを示した(Yamamoto and Terada, 2014, CSDA)。また、FPCK法やFFKM法を含む多くのクラスタリング法において、クラスター構造とは無関係にデータが相関を持つ場合などに、クラスタリングの性能が阻害されてしまう。これは関数データではない通常の多変量データにおいても同様であり、このような構造(disturbing structure)に対処するための方法としてGeneralized Reduced Clustering(GRC)法を開発した(Yamamoto and Hwang, 2014, Behaviormetrika)。さらに、多変量関数データにおけるdisturbing structureを定式化しGRC法を拡張することで、多変量関数データに対する柔軟なクラスタリング法を開発した(Yamamoto and Hwang, in revision)。この方法を用いることで、データの構造にあわせて柔軟なモデリングが行えるとともに、従来の方法では捉えることの出来ないクラスター構造を推定することが可能となった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
多変量関数データのクラスタリング法として、既存の方法の欠点を補うことの出来る新たな方法を提案できた。さらに、より本質的にクラスタリングの精度を阻害する構造を定式化し、それを克服できる新たな方法を提案できた。この方法により、時間・空間に依存する多変量関数データにおいてもより柔軟にクラスター構造の探索が行うことが出来ると考えられる。計画通り、関連する研究の成果について、各学会(International Biometric Conference, International Conference on Computational Statistics, 日本行動計量学会大会、統計関連学会連合大会など)で発表を行い、それらの学会での結果をフィードバックして結果をとりまとめたものを論文投稿中である。また、損失関数の一致性などの理論的な検討も現在行っている。
|