研究概要 |
Webからの知識獲得方式の研究として, 与えられた語に関する典型的な話題語・同位語・上位語・下位語等といったontologicalな知識をWeb全体から近似的に抽出するために, 両方向構文パターンを用いてサーチエンジンの索引データにアクセスし高速に知識獲得を行う方式や, 上位・下位関係に基づく属性情報の継承構造を用いて求める手法を開発した. さらにWebから抽出したオブジェクトの同一性判定を高精度に行うため, オブジェクトの属性が変化する確率や属性抽出で誤りが生じる確率を考慮してオブジェクト識別を行う方式を提案した. さらに, 知識やオブジュクトのレベルの時間的な変化を視覚化する手法として, ある対象となる語の同位語の時間的な変化を閲覧できるシステムも開発した. ユーザ・コンテクストの抽出に基づくコンテクストアウェアな情報検索方式の研究では, 語ベース適合フィードバックと並列サーチに基づく複数検索結果のリランキング方式の改善, 画像ソーシャルブックマークのタグ情報をマイニングした情報を用いた既存のWeb画像検索エンジンの再現率向上手法の開発, 大規模クエリログからの同位語・話題語の自動抽出方式の研究を行った. コンテンツの操作環境のシームレス融合技術の研究では, 閲覧中のWebページの内容から自動的に内容を補完するページを検索できるWebブラウザ, Web検索行動とWebから抽出した知識を用いた検索意図推定・自動質問修正方式を開発した.
|