2017 Fiscal Year Annual Research Report
High Precision Information Retrieval and Recommendation based on Copulas
Project/Area Number |
15H02701
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
宮崎 純 東京工業大学, 情報理工学院, 教授 (40293394)
|
Co-Investigator(Kenkyū-buntansha) |
波多野 賢治 同志社大学, 文化情報学部, 教授 (80314532)
中村 匡秀 神戸大学, システム情報学研究科, 准教授 (30324859)
欅 惇志 東京工業大学, 情報理工学院, 助教 (00733958)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 情報検索 / Copula / 情報推薦 / スコア統合 |
Outline of Annual Research Achievements |
本課題は、索引語やキーワードなどのテキスト情報の適合性やアイテム、ユーザの嗜好や状況等を周辺分布としてモデル化して入力とし、コピュラ関数によりこれらの入力間の因果関係を考慮して、出力である適合情報の分布を表現する同時確率分布を導き、適合理由を直観的に表現可能な新しい情報検索・情報推薦システムの提案を目的としている。 本年度は、情報検索ならびに情報推薦へのコピュラへの適用について研究を遂行した。情報検索については、多峰性コピュラを構成する際のデータ分布のクラスタリング方法について改良を行った。具体的には適合文書のクラスタリング手法として密度ベースのアルゴリズムを適用し、適合文書の密集度と外れ値を考慮し、より正確なコピュラ関数の推定を可能とした。その結果、Web検索のベンチマークにおいて検索精度が向上することを明らかにした。また密度ベースクラスタリングアルゴリズムを拡張することにより、さらに検索精度が上がることを確認した。現在、拡張したクラスタリングアルゴリズムをさらに改良し、検索精度が向上するような最適なクラスタの抽出を自動化する研究を進めている。 一方、情報推薦のコピュラの適用については、ユーザの嗜好に偏りがある場合や離散値特徴量をコピュラで扱うための手法について研究を行った。コピュラを利用した手法では各特徴量の単調性を仮定するが、ユーザの嗜好を単調増加で表現できない場合は、許容範囲フィルタと名付けたフィルタで不適合推薦アイテムを取り除く仕組みを取り入れた。さらに、特異な嗜好を判定するための分布差を計測するKL情報量を改良し、より正確に嗜好の差を判定する方法を提案した。事例研究を通して提案手法は既存手法や機械学習手法よりも高精度でアイテムを推薦可能であることを示した。
|
Research Progress Status |
29年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
29年度が最終年度であるため、記入しない。
|