クラスタリングはデータの構造化等のための重要な手法として位置づけられている。本研究では、超球面上に附置されるデータに対してノイズが含まれる場合にクラスタリングするための方法論を確立することを目的として、さらに、従来法と開発手法との数理的関連性を通じて、この超球面ノイズデータのためのクラスタリングアルゴリズムの開発に取り組んだ。 通常のクラスタの他にノイズ個体を吸収するためのクラスタを仮定する手法についてアルゴリズムを開発した.また,その数理的特性を明らかにした.さらに、その数理的特性を実験的に確認した。 一方で,裾野の重い確率密度分布を用いる手法について,要素分布の自由度を表すパラメータ推定のための超幾何関数に関する零点を数値的に得るのが難しいことを実験的に確認した. リニアノイズデータに対してはクラスタが偏在する部分空間を抽出しながらクラスタリングする部分空間クラスタリング技法が確立されているが、超球面ノイズデータに対してそのまま適用することができないことを踏まえて,部分空間の代わりに部分超球面を抽出しながらクラスタリングをする手法を開発した。 推薦システムへの応用を踏まえて,球面クラスタリングと協調フィルタリングを組み合わせたアルゴリズムを開発し,実データに適用した結果,従来提案されていた単体データのためのクラスタリングと協調フィルタリングを組み合わせたアルゴリズムに比べて高い推薦精度を達成した.この成果を雑誌論文に掲載した.
|