2005 Fiscal Year Annual Research Report
Project/Area Number |
16680008
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
村田 剛志 東京工業大学, 大学院・情報理工学研究科, 助教授 (90242289)
|
Keywords | インターネット高度化 / 人工知能 / 機械学習 / Webコミュニティ |
Research Abstract |
Webページの多くは、関連するページへのハイパーリンクを有しており、Webコミュニティと呼ばれるグラフ構造を構成している。この構造についての知見を得ることは、Webから効率的な情報収集をするうえで重要である。本研究課題では以下の研究に取り組む。(1)ハイパーリンクにおけるグラフ構造のモデル化:Webのハイパーリンクによって構成されるグラフ構造のモデル化を目標とする。グラフにおける頂点の次数、連結成分の大きさ、到達可能性等に注目し、Webコミュニティにおける典型的なグラフ構造についての分析を行なう。(2)Webコミュニティを利用した情報収集・活用:関連する内容のWebページ集合であるWebコミュニティにおけるグラフ構造を分析し、具体的な応用手法について考察する。平成17年度においては、(1)に対する取り組みとして、同種の構造を持つと推測されるグラフ構造として、オンライン百科事典であるWikipediaに対して予備的な分析を行なった。(2)に対する取り組みとして、コミュニティ等の部分グラフ構造の評価指標として、PageRank等のランキングアルゴリズムをグラフ全体に適用し、そのランキング上位の頂点を含む割合によってコミュニティの質を評価する実験を行なった。また、上記の2項目とは別に、実際の検索エンジンの処理内容を調べるために、Yahoo!やMicrosoftなどの検索エンジンの記事を含んだ特集[検索エンジン2005」を情報処理学会誌において企画・編集した。
|