研究課題/領域番号 |
25330363
|
研究種目 |
基盤研究(C)
|
研究機関 | 神戸大学 |
研究代表者 |
関 和広 神戸大学, その他の研究科, 准教授 (30444566)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | Twitter / マイクロブログ / 疑似適合フィードバック / クエリ拡張 / リアルタイム / コンセプト |
研究概要 |
平成25年度は,マイクロブログ(例:Twitter)を対象に,時間情報と非時間情報を用いたクエリ拡張によるリアルタイム検索に関する研究を行った.マイクロブログは,現実世界で起きる事件や出来事といった「イベント」の注目度や盛り上がりに連動して,その話題に関する投稿が急激に増減するというリアルタイム性に特徴がある.この特徴をクエリ拡張に利用し,時間的に変化するユーザの検索意図を的確に予測することで,検索精度を顕著に向上させることに成功した.より具体的には,言語モデルに基づく情報検索の枠組み(クエリ尤度モデル)を適合モデルに導入した疑似適合フィードバックを拡張し,単語の頻度だけでなく文書のタイムスタンプも利用した適合モデルを提案した.さらに,単語の組み合わせによるコンセプトを用いたクエリ拡張手法である潜在コンセプト拡張(Latent Concept Expansion)[Metzler & Croft, SIGIR 2007]にも同様に時間情報を導入した.情報検索研究における代表的なテストコレクションであるTREC2011および2012のマイクロブログトラックのデータセットを用いた実験により,従来の語彙情報だけを用いる適合フィードバックよりも,本手法が複数の評価指標で優れた検索性能を示すことが示された.特に,コンセプトの語彙情報と時間情報を用いる手法は,適合度が高い文書の検索に関して優れた検索性能を示すことが明らかになった.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
当初計画していた順位学習器を用いる手法だけでなく,適合モデルおよび潜在コンセプト拡張への時間情報の導入を提案し,良好な結果を得ることができた.また,それらの成果を情報検索分野の代表的な国際会議であるCIKM,ECIR,AIRSや複数の学会論文誌で発表した.
|
今後の研究の推進方策 |
リアルタイム検索については一定の成果が得られたため,計画に沿って,今年度はマイクロブログやニュースストリーム等のリアルタイム性が高いテキスト情報を基に経済指標の予測・分析を行う.また,大規模ストリームデータ処理に関する知見を得るため,米国NISTが主宰する評価型ワークショップTRECのTemporal SummarizationトラックおよびKnowledge Base Accelerationトラックに参加する予定である.
|
次年度の研究費の使用計画 |
残金が1000円以下と少なく,当該補助事業に有効に使用することができなかったため. 次年度の交付金と合わせて,採録論文の掲載料として使用する.
|