研究概要 |
近年,複数のWebページから,オブジェクト単位で属性や関係を抽出してデータベースに格納し,その結果をユーザに呈示するオブジェクトレベル検索エンジンの研究が進められている.Webからのオブジェクト検索における重要な研究課題の一つとして,オブジェクトの時間変化への対応がある.人物などの実世界のオブジェクトは,その属性や他のオブジェクトとの関係が,時間とともに変化する.情報が上書きで更新される管理されたデータベースと異なり,Webにおいては過去の情報が残ったまま,新しい情報が追加されていく場合が多い.オブジェクトの属性値や関係が時間変化することにより,古い情報を誤って提示したり,同一オブジェクトを別オブジェクト誤って判定したりといった問題が生じる.本研究課題の目的は,時間変化するオブジェクト情報のWebからの効率的な収集と管理を可能とすることである.そのために,本年度は以下の研究を行った.時間変化するオブジェクトの同一性判定問題を,時間的に離れたデータ間の関係を予測する時間横断的リンク予測問題として定式化した.予測に有効な特徴は時間とともに変化するため,異なる時点でのデータを共通の低次元の特徴空間に射影して比較することで,精度の良い予測を行う方式の研究を行った.,時間に依存する複数の射影行列は機械学習を用いて決定されるが,行列の一般化固有値問題に帰着することで一度に求めることができる.また,オブジェクトやイベントの時間的な重要度を時間横断的なリンク解析を行うことで計算する方式,イベントの空間的曖昧性をWebにおける人名や地名との共起確率に基づき解決する方式などの研究を行った.
|