研究概要 |
従来の対話的文書検索では,システムはユーザが評価した文書だけを用いて,残りの文書を検索しており,評価された文書に対し膨大な量である残りの文書のもつ情報を積極的に利用してこなかった.しかし,機械学習の分野では,近年この評価されていない文書を利用する学習方法が提案されており,それらの手法を用いることで,これまで対話的文書検索ではまったく利用されていなかった評価されていない文書を利用して,検索効率を飛躍的に向上することが期待できる.さらに,対話的システムでは,人間の認知負荷を考慮したシステム設計が必須である.本研究では,トランスダクティブ推論に基づく機械学習手法を用いた対話的文書検索システムを,人工知能,特に機械学習の技術を基に研究開発することをその研究目的とする. このような目的のもとに,本研究では,トランスダクティブ推論の概念をサポートベクターマシンによる能動学習の枠組みに導入し,ユーザの所望に近い文書であると同時に,ユーザに評価してもらうことで,検索システムにとっても有用な情報の得られる文書であるものを選択できる方法(この方法を「能動的文書選択」と呼ぶ)を開発し,システム実装,ベンチマークデータによる検索効率評価を行った. 本研究が達成されたことにより,検索ユーザは,一度キーワードを入力するのみで,後は検索ユーザが検索システムの提示する文書に対し,「適合文書」(○),「非適合文書」(×)の評価を行うだけで,検索ユーザは次々とユーザの所望の「適合文書」を効率的に発見することができるようになる.特に,ユーザは新たなキーワードを作り出すストレスから開放されるとともに,検索システムとの「○」,「×」という簡単なコミュニケーションで,毎回ユーザの所望に近い文書が出てくるため,検索ユーザに認知負荷がかからない点も重要である.
|