2012 Fiscal Year Annual Research Report
時空間メタデータ検索をキーワード検索に統合したウェブ検索エンジンの実現
Project/Area Number |
11J01016
|
Research Institution | University of Tsukuba |
Principal Investigator |
吉田 光男 筑波大学, システム情報工学研究科(系), 特別研究員(DC1)
|
Keywords | 情報検索 / ソーシャルメディア / カテゴリ推定 |
Research Abstract |
本研究は,検索されたキーワードからメタデータを推定し,メタデータによる絞り込みを自動的に行うウェブ検索エンジンの実現を目的とする。本研究の目的を達成するために,本年度は特に(1)ソーシャルメディアを用いた検索クエリのカテゴリ推定,(2)ウェブコンテンツ抽出の検討,の2点に取り組んだ。 本研究を達成するためには,検索されたキーワードが,どのような種類のキーワードであるかの判定が欠かせない。また,ある検索キーワードの生存期間(ユーザによって頻繁に検索される期間)は非常に短いことがわかっており,検索キーワードの特性を短時間で学習する必要がある。本年度は,昨年度よりも推定するカテゴリの幅を広げ,また,実際にトレンドになった検索キーワードに絞ることで,より現実的な課題に取り組んだ.トレンドになった検索キーワードを対象とする場合,ソーシャルメディアのデータを活用すると,ニュースなど従来のデータを使うよりも高精度に分類可能なことが明らかになった. 本研究が目指す最終的な成果物はウェブ検索エンジンであり,ブログなど,一般的なWebページを対象とする。Webページのコンテンツのみを検索できるようにするために,ウェブコンテンツ抽出の処理が欠かせない。既存のコンテンツ抽出手法を改良し,従来手法では難しかった,ブログコンテンツのポスト及びコメントを自動的に識別する手法を開発した。この成果により,より高精度なウェブ検索エンジンの開発が期待できる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
現実的な状況を再現した場合のカテゴリ分類精度が課題であったが,当初の仮説通り,ソーシャルメディアのデータを活用することでよりよい分類性能が実現できた。更に,一般的なWebページのコンテンツ識別にも成功した。
|
Strategy for Future Research Activity |
検索キーワードのカテゴリ分類実験に関し,人手によって正解データの作成を行ったため,これらのデータを公開したいと考えている。また,ソーシャルメディアのデータ特性を,従来のデータと比較することで詳細に調査する。拡張したカテゴリ分類を応用し,検索キーワードと位置情報との関連づけの検討を行う。
|
Research Products
(2 results)