研究課題
Webページの多くは、関連するページへのハイパーリンクを有しており、Webコミュニティと呼ばれるグラフ構造を構成している。この構造についての知見を得ることは、Webから効率的な情報収集をするうえで重要である。本研究課題では以下の研究に取り組む。(1)ハイパーリンクにおけるグラフ構造のモデル化:Webのハイパーリンクによって構成されるグラフ構造のモデル化を目標とする。グラフにおける頂点の次数、連結成分の大きさ、到達可能性等に注目し、Webコミュニティにおける典型的なグラフ構造についての分析を行なう。(2)Webコミュニティを利用した情報収集・活用:関連する内容のWebページ集合であるWebコミュニティにおけるグラフ構造を分析し、具体的な応用手法について考察する。平成17年度においては、(1)に対する取り組みとして、同種の構造を持つと推測されるグラフ構造として、オンライン百科事典であるWikipediaに対して予備的な分析を行なった。(2)に対する取り組みとして、コミュニティ等の部分グラフ構造の評価指標として、PageRank等のランキングアルゴリズムをグラフ全体に適用し、そのランキング上位の頂点を含む割合によってコミュニティの質を評価する実験を行なった。また、上記の2項目とは別に、実際の検索エンジンの処理内容を調べるために、Yahoo!やMicrosoftなどの検索エンジンの記事を含んだ特集[検索エンジン2005」を情報処理学会誌において企画・編集した。
すべて 2005
すべて 雑誌論文 (2件) 図書 (1件)
情報処理学会誌 Vol.46,No.9
ページ: 979-1015
Proceedings of the Second international Conference on Fuzzy Systems and Knowledge Discovery (FSKD2005) LNAI3614
ページ: 1204-1207