本年度は、OPACの検索精度の改善に向けた研究を行った。特に、ソーシャルネットワークの一種である共著ネットワークを利用し、ユーザの関心を日本十進分類コード(NDC)の分布として表しOPACの検索結果を再ランクすることで、その精度を改善しようとするアプローチを提案した。文学系のドメインについて、現在の国立国会図書館OPACとの比較を行い、本手法の評価を行った。 書誌には十分なテキスト情報がないため、通常の文書検索のように語彙情報に頼ったランキングは効果が期待できない。このため、本研究では、テキスト情報に依存しないランキング手法を考案した。基本的なアイディアは、「ユーザプロファイル」と「コミュニティプロファイル」という概念を導入し、ユーザの検索指向をNDCの分布としてモデル化し、その上で書誌に付随する分布においてどの程度出現しやすいか計量し、その現れやすさによって書誌のランキングを行おうというものである。本年度は特に、検索性能の最適化に向けたパラメータの学習方法について検討した。 実際に国文学の研究者3名を被験者にして国立国会図書館のOPACの検索データをもとに評価実験を行ったところ、いずれも本手法が現在の国立国会図書館のOPACの検索結果の改善につながることが明らかになった。
|