Research Abstract |
本年度はトランスダクティブ推論の概念をサポートベクターマシンによる能動学習の枠組みに導入し,ユーザの所望に近い文書であると同時に,検索システムにとっても有用な情報の得られる文書であるものを選択できる方法のシステム実装,および,大規模なベンチマークデータによる検索効率評価を行った.検索効率の評価のため,ユーザ指向の評価とシステム指向の評価を行った.ユーザ指向の評価の評価指標として,検索結果の上位10,30文書における検索精度を表すP10,P30を用い,システム指向の評価の評価指標として,一つのトピックに対し,検索結果の上位から適合文書が得られる毎に精度を計算し,その全ての精度を平均したMAP,および,検索結果の上位から最初に精度が0.5以下になったときの再現率であるR05Pを採用した.従来のRocchio-based法(Ro),および,サポートベクターマシンを用いてはいるが,我々が提案する方法とは異なる方法(S-N)と,我々が提案する方法(S-A)とで,前述の評価指標を比較した.ユーザへの提示文書20の際,S-AはP10が0.404,P30が0.285,MAPが0.177,R05Pが0.158であった.S-Nでは、P10が0.189,P30が0.141,MAPが0.087,R05Pが0.075であり,Roでは,P10が0.266,P30が0.201,MAPが0.130,R05Pが0.119であった.以上のことから,提案する方法が,検索効率評価のために用意した全ての指標で,一番良い精度を示していることを確認できた. また,適合性フィードバック文書検索の初期において,非適合文書情報のみしか得られない場合があるが,本年度は,これに対処する方法として,One Classサポートベクターマシンを用いる方法を提案した.さらに,提案方法を小さなベンチマークデータに適用し,その有効性を検討した.
|