World Wide Web上のコンテンツの信頼性を定量的に評価する手法の構築を目的として、テキストマイニング・ウェブ構造解析、ならびにウェブアーカイブを利用した研究を進めた。特に混合分布等の確率モデルを推定プロセスに導入することによって、学習に基づく新たな信頼性評価手法を構築した。 具体的にはウェブから大量のテキストデータを収集し、集約によって概念レベル/命題レベルでの知識抽出を行った。さらに、集約されたデータの統計的頻度・空間的分布、ならびに時間変化等を特徴量として用い、得られた知識の信頼性を自動推定するシステムの開発を行った。確率モデルの導入はノイズの低減にも効果があり、従来手法に比べて評価尺度の精度向上が実現された。
|