本年度は、まず、事象知識の獲得につながる基礎技術として、時間グラフパターンの提案とそのマイニング手法の提案を行った。既存のグラフパターンは、グラフの点と辺の隣接関係の特徴を抽出したものであるが、時間グラフパターンは点に時間を表すラベルを加えることによって、時間的特徴も表すことができる。既存のグラフマイニングアルゴリズムを用いて時間グラフパターンのマイニングを行うために、ウェブページ数の増減や検索エンジンにおける検索回数の増減を点のラベルとして反映させるラベリング手法を提案した。この手法を用いて、ウェブ上で短期間で盛り上がった話題の時間グラフパターンをマイニングし、そのような話題に特徴的な一時情報源・盛り上げ役・まとめ役のサイトの分類ができることを示した。さらに、得られたパターンをウェブグラフ上で検索することによって、新しい事象知識を得ることができることを示した。次に、得られた事象知識をDB化するために、事象モデルを提案し、事象知識の豊富なWikipediaを用いて事象知識DBの作成ができることを確かめた。また、記述が違っても同一の事象を検出するために、この事象モデルに基づく同一事象判定手法を提案した。さらに、得られた事象知識の関係を、人間がさらに深く理解するための基礎技術として、2個の概念間のグラフ構造で表される関係のモデルと関係の強さを求める手法を、generalized flow(減衰流と呼ぶことにした)を用いて構築することに成功した。このモデルと手法によって、既存のものより正確に関係の強さを測り、さらに関係を説明する概念やウェブページ、画像の発見も行えることを示した。これは、Wikipediaの知識とWeb上の知識を相補的に利用している。この結果をユーザーに提示するため、「縁(えにし)」と名付けたシステムを開発し、公開している。また、この関係知識を用いてWikipediaの画像の信憑性判定を支援する「画像の記事に対するふさわしさ」を求める手法を提案した。
|