研究実績の概要 |
本年度は,ユーザの情報要求が反映されたブーリアン型検索クエリを入力として,関連論文を網羅的に収集するためのランキング手法の開発を行った.具体的には,ユーザーの視点に立った高度な学術論文検索支援に関する総合的研究(15H01721)で取り組んだ網羅的な検索手法の開発を発展させ,ユーザがチェックできる数の検索結果に対して,再現率を更に改善させることができるかどうか調査した. 以前の研究との違いとして,Weiらが開発した手法以外のクエリ尤度モデルによるランキング手法やベクトル空間モデルに基づいたランキング手法によるランキング結果と,我々が開発したトピックベースのランキング手法によるランキング結果との統合を行った.また,トピックベースのランキング手法において,LDA (Latent Dirichlet Allocation)によるトピック分析に対して,SA (Simulated Annealing)法を導入した. 実験では,NTCIR-1,2テストコレクションに収録されている41件の検索課題を用い,ランキング結果の上位100, 200, 500, 1,000件を検索結果として獲得する場合に対する再現率で評価した.その結果,ベクトル空間モデルでは分散表現を用いたランキング手法,クエリ尤度モデルではLDAによるトピック分析結果を用いたランキング手法,および我々が開発したランキング手法間でほぼ同等の再現率を示した.そして,いずれの従来手法に対して,提案手法によるランキング結果を統合させることで,すべての検索条件において再現率が向上した.今後は,ベクトル空間モデルとクエリ尤度モデルにおける各ランキング手法,および提案手法による3種類のランキング結果を統合させることで,更に再現率が向上するかどうか調査する.
|