研究概要 |
本研究ではWeb上のスパムブログ(splog)空間の定量分析に基づき,効率的にsplogをフィルタリングする手法の開発と評価を行った.日本語,中国語,英語,韓国語のsplogを収集し,正解データ集合を作成した.正解データ集合を分析した結果,splog判定に個人差が見られることを確認した.機械学習を用いて各個人のsplog判定傾向を学習し,各個人に対して最適なsplogフィルタを提供するシステムの開発と評価を行った.日本語splog正解データ集合を用いて評価を行った結果,従来手法に比べ性能改善が可能であることを確認した.
|