研究課題
基盤研究(C)
本研究では大規模文書クラスタリングにスペクトラルクラスタリングを用いる手法を開発した。基本的には大規模データをk-meansで予め小規模クラスタに分割し、そこから信頼度の高いデータを抽出し、それらデータに対して類似度行列を作る。作成された類似度行列は縮約されているので、スペクトラルクラスタリングが実行できる。クラスタリングの更なる精度向上のために、精緻な名詞間距離の測定法や、文書間の距離学習法の開発も行った。
すべて 2011 2010 2009 2008
すべて 学会発表 (6件)