研究課題
若手研究(A)
本研究代表者はハイパーリンク等のグラフ構造に基づいてWebページ等の対象間の関連性を見出すWebマイニングの研究を進めてきている。Webページの多くは、関連するページへのハイパーリンクを有しており、Webコミュニティと呼ばれるグラフ構造を構成している。このような密な部分構造についての知見を得ることは、Webから効率的な情報収集をする上で重要である。本年度においては、ユーザの振る舞いをログデータから理解するための試みとして、ログデータから得られるグラフ構造をもとに、関心サイト集合を抽出し視覚化する手法を考案し実験を行なった。対象とするログデータとして、クライアント側から得られるインターネット視聴行動のローデータを用いた。このデータには、ユーザが訪問したサイトおよび検索で入力したキーワードが含まれている。特定のユーザのローデータから、サイトやキーワードを頂点とし、時間的な前後関係を辺としたグラフ(サイト・キーワードグラフ)を生成した。このサイト・キーワードグラフから中心的な部分グラフを抽出することで、対象ユーザの関心を見出すことができる。2004年12月の1ヶ月間における8,000人以上のユーザについてローデータを用いて実験を行ったところ、もとのサイト・キーワードグラフの30パーセント程度の中心的な部分グラフを抽出した。それをGraphvizによって視覚化することで、抽出された部分グラフの分析も行った。ハイパーリンクによって結合したWebページのグラフ構造に対して適用するランキングやコミュニティ発見の手法は、主としてWeb構造マイニングの手法であるが、ログデータの分析に対してもそのような手法が有効であることを示すことができた。
すべて 2006 2005 2004
すべて 雑誌論文 (7件) 図書 (2件)
知能と情報 Vol. 18, No. 2
ページ: 213-222
110004729024
知能と情報 Vol. 18, No. 5
ページ: 701-710
110004821176
Proceedings of the 2006 IEEE/WIC/ACM Int' l Conf. on Web In telligence and Intelligent Technology (WI2006)
ページ: 343-346
情報処理学会誌 Vol.46,No.9
ページ: 979-1015
Proceedings of the Second international Conference on Fuzzy Systems and Knowledge Discovery (FSKD2005) LNAI3614
ページ: 1204-1207
Proceedings of the Third International Workshop on Social Intelligence Desin (SID 2004)
ページ: 111-118
Proceedings of the Third International Conference on the Theory and Application of Diagrams (Diagrams 2004), LNAI2980
ページ: 235-238