2012 Fiscal Year Annual Research Report
ネットワークの成長過程に基づくスケーラブルな時間付き特徴生成の実現
Project/Area Number |
12J02449
|
Research Institution | Kobe University |
Principal Investigator |
宮西 大樹 神戸大学, 大学院・システム情報学研究科, 特別研究員(DC2)
|
Keywords | 時間付き特徴生成 / 時間情報を考慮した情報検索 / マイクロブログ検索 / 擬似適合フィードバック |
Research Abstract |
【目的】時間と共に変化するデータ(データストリーム)から,時間情報に関する特徴を抽出する. 【内容】上記目的を達成するため,我々はマイクロブログサービスの大手であるTwitterのデータから,時間情報に基づく擬似適合フィードバック手法を用いて時間付きの特徴を抽出する方法を提案した.Twitterのデータは,特別な出来事が起こると大量のデータがユーザによって作成されるリアルタイム性を有している.このリアルタイム性をトピックごとに自動検知・モデル化することで,時間付きの特徴を作成する.しかし,ユーザにとって興味のあるデータは比較的少量であるため,大量のデータすべてを処理して特徴を抽出することは現実的ではない.そこで,研究員は情報検索の分野で頻繁に用いられる擬似適合フィードバックとよばれる手法を独自に改良し,ユーザが関心を持つデータだけを全データから抽出し,そのデータを用いて特徴を作成した.ここで,時間付きの特徴をデータのタイムスタンプの経験分布とすることで,いつ何が注目されたかを表現した.さらに,研究員はこの特徴を時間情報に基づく情報検索に応用することで,検索精度を著しく向上させることに成功している. 【意義】時間情報を考慮した情報検索では,いつ何が起きたかを知ることが目的であるため,ユーザの検索意図に応じて,適切に時間付きの特徴を表現するかが重要になる.我々が提案した手法では,ユーザが興味を持つ話題の時間情報に着目することで,スケーラブルに時間付きの特徴を生成することを可能にした.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究員は,研究目標である時間付きの情報をスケーラブルに生成することに成功しており,その成果を論文誌1本,国際会議2本としてまとめることができた.
|
Strategy for Future Research Activity |
研究員が提案した手法は,データストリームからユーザにとって興味のある話題に対して時間付きの特徴を取り出し,それを情報検索に役立てるものであった.しかし,ユーザの意図とその時間を明示的に表すことは困難である.例えば,数日・週間前のとある人物の発言した内容を知りたい場合,既存の検索エンジンだと,ユーザはいつの情報が欲しいかを具体的に表現する必要がある.そこで,現在はユーザにとって理解しやすい形で各話題の時間的特徴をユーザに提示し,その時間的な特徴をユーザに明示的に選択してもらうことで,上記の問題に対処することを検討している.
|
Research Products
(3 results)