2001 Fiscal Year Annual Research Report
我国における全WEBグラフからのサイバーコミュニティの抽出とその成長過程の解析
Project/Area Number |
13480078
|
Research Institution | The University of Tokyo |
Principal Investigator |
喜連川 優 東京大学, 生産技術研究所, 教授 (40161509)
|
Co-Investigator(Kenkyū-buntansha) |
中野 美由紀 東京大学, 生産技術研究所, 助手 (30227863)
柴山 悦哉 東京工業大学, 大学院・情報理工学研究科, 教授 (80162642)
|
Keywords | World Wide Web / データベース処理 / コミュニティ発見 / Webページ・クローリング |
Research Abstract |
本研究では、わが国の全Webページから、潜在するサイバーコミュニティを抽出すると同時に、コミュニティの発現・成長過程、並びに、コミュニティ相互関連性を明らかにすることを目的とする。つまり、概ね1億程度と推定されている(米国の約1割弱)わが国のWebページを、独自に開発したクローラにより収集した後、ハイパーリンクにより結合された巨大なグラフ構造を導出する。1億ノードという巨大グラフ構造を一台のマシンで効率良く処理することは困難である事から、本研究者らが長年に亘って開発して来たDBカーネルなる並列データベース処理系を利用することにより既存設備であるPCクラスタ上に高性能ワークベンチを構築し、サイバーコミュニティ抽出実験を行うを研究目的とする。 本研究の情報収集のために、WWW関連の国際会議として最大規模のWWW10に参加し、現在のWWWに関する最新のシステム情報、新たなコミュニティ発見アルゴリズムなどについての情報収集を行った。さらに、コニュニティ発見アルゴリズムと日本のWEBページを用いた結果について、海外の研究者と情報交換を行った。 また、米国ACMのSIGMODが主催するデータベースの研究集会としては世界最大規模の国際会議SIGMOD2001に出席をし、Web DBなどの基礎研究について情報を収集するとともに、最新の大規模データベース処理技法などに関する情報交換を行った。
|