研究概要 |
膨大な量のWWWの世界から有用なページ群を抽出することが本研究の目的である。本研究では、それぞれのページに埋め込まれたリンク情報に着目し、それをページ作成者の有用性の判断として利用することにより、関連するのページの固まりを発見する手法を研究する。リンク情報は、中身がどのような言語で書かれていようと無関係にアルゴリズムの適用が可能になる. これまで開発してきたリンク構造可視化ツールを用いて、Web Graphの構成実験を行なってきた。実験システムについては、Discovery Science 99の国際会議にて発表した。大学内のホームページ群を表現したWeb Graphにおいて、大学のトップページへは非常に多くのリンクが密集していて、その重要性は認識できるが、そのようなリンクをすべて可視化すると、逆に,全体の構造が見えなくなる。このようなAuthorityを省くことにより、分かりやすい構造のWeb Graphが選られる。これは、Web Graphにおけるin-degree, out-degreeの分布がZipfの法則に従うという事実によることが判明した。 今後、有用なリンク構造の評価基準を定式化し,評価基準を満たすページの発見アルゴリズムの開発を行う予定である。
|