研究概要 |
本年度は,まず前年度に引き続き「トランスダクティブ学習を利用した最小ユーザフィードバックによるクエリ拡張方法」について研究を継続した.本年度は特に既存の高性能なクエリ拡張手法(言語モデルをベースにした手法)との比較実験を行い,その結果を論文にまとめた.比較実験において,提案手法は全体的な検索精度については比較手法とほぼ同等の結果を示した.また,提案手法は,比較手法に比べて拡張単語数が圧倒的に少なく,検索に要する計算コストが少なくて済むという利点があるという結論が得られた.従来のフィードバックを利用した検索改善方法はフィードバックコストが考慮されておらず,実際の利用を考えた場合にユーザに大きな負担を強いることが予想されたが,本研究では現実的なフィードバックコストでフィードバックがない場合よりも性能を上げることができており,他の対話的なシステムへの応用についても期待することができる. 次に,Connectivity Kernelを利用したクラスタリングへの制約付与方法について検討した.クラスタリングでは,一般にクラスタ内距離(クラスタ内メンバー間の距離の総和)とクラスタ間距離(クラスタ中心またはクラスタ代表点間の距離)を減らすことでよいクラスタが得られるとされているため,我々はこの2つの距離を減らすことができる制約を選択する方法を提案することとした.また,クラスタ間距離として2クラスタ間にSVMによって作成した超平面からのマージンを利用することで,uncertainty samplingによる制約選択を行うこととした.
|