研究概要 |
実世界に存在するオブジェクトに関する多くの情報は, 時間に関連付けられる場合が多い. 例えば, 人物の行動や発言, 企業の製品発表などのイベントには, そのイベントが発生した時点がある. また, 検索を行うユーザの側にとっても, それがいつの時点での情報なのかを確認することは重要であり, 履歴の形で情報を整理してユーザに呈示することで, 閲覧の支援が可能になると考えている. そこで, Webページから, 履歴情報を日付とイベントの組の形で抽出をし, 抽出結果から重複を除いて年表のように時系列で呈示する方式を研究する。そのために, 本年度は以下の方式の研究を行った. 人物や企業などの実世界のオブジェクトの多くは, その属性(所属や連絡先, 代表者や所在地など)が時間とともに変化する. Web上には時期の異なる情報が混在しているため, これらの情報が誤って別オブジェクトのものであると認識されてしまう可能性がある. 精度の高いオブジェクト識別を行うためには, オブジェクトの時間変化の可能性を考慮する必要がある. そこで, 一定期間にオブジェクトの属性が変化する確率を用いてオブジェクト識別を行う方式の研究を行った. 例えば, 1年間に人物の所属が変わる確率や, 企業の規模がある大きさで変動する確率である. このような属性の時間変化の確率を表す具体的なモデルを人物と企業を対象オブジェクトとして構築することを試みた. また, これらの確率モデルに基づく, オブジェクトの属性の時間変化を考慮したクラスタリングアルゴリズムを開発した. さらに, 人物および企業のオブジェクト識別問題で実験を行い, 提案手法の識別精度向上への寄与を評価した.
|