研究課題/領域番号 |
20500124
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 茨城大学 |
研究代表者 |
新納 浩幸 茨城大学, 工学部, 准教授 (10250987)
|
研究期間 (年度) |
2008 – 2010
|
研究課題ステータス |
完了 (2010年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2010年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2009年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2008年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | 縮約類似度行列 / スペクトラルクラスタリング / 文書クラスタリング / 距離学習 / 最大マージン化最近傍法 / 大規模データ / コミッティ / 名詞間距離 / シソーラス |
研究概要 |
本研究では大規模文書クラスタリングにスペクトラルクラスタリングを用いる手法を開発した。基本的には大規模データをk-meansで予め小規模クラスタに分割し、そこから信頼度の高いデータを抽出し、それらデータに対して類似度行列を作る。作成された類似度行列は縮約されているので、スペクトラルクラスタリングが実行できる。クラスタリングの更なる精度向上のために、精緻な名詞間距離の測定法や、文書間の距離学習法の開発も行った。
|