2001 Fiscal Year Annual Research Report
ハイパーリンクのグラフ構造に基づくWebコミュニティに関する研究
Project/Area Number |
13224091
|
Research Institution | National Institute of Informatics |
Principal Investigator |
村田 剛志 国立情報学研究所, 情報学基礎研究系, 助教授 (90242289)
|
Keywords | Web structure mining / 発見 / Webコミュニティ / ハイパーリンク / グラフ構造 |
Research Abstract |
本研究では、(1)Webコミュニティにおける構造のモデル化(2)Webコミュニティにおける動的変化の検出の二つを目標としたが、今年度は今後実験を進めていくための準備作業や、従来から行なってきた実験をさらに発展させる形で研究を進めた。前者としてはNTCIRのテストコレクションとして収集しているWebデータのリンク情報を利用するために、その大きさやデータ構造等についての調査を行なった。後者としては、Webページのハイパーリンクによって構成されるグラフ構造に基づいて、興味を共有するWebページ集合であるWebコミュニティを発見するシステムを既に構築しており、そのシステムをさらに発展させて当該トピックにおける中心的なページ集合を見出すような洗練手法を考案した。重要な内容をもつ中心的なWebページは他のページとのリンクが密であると考えられることから、2部グラフで表されるWebコミュニティにおいて、グラフが密になるようなページの選択を反復的に繰り返すように発見手法の改良を行なった。この手法に基づいたシステムを実現し、数十のトピックについてそのトピックに関するランキングの下位のページ集合を入力とし、洗練によって上位のページ集合が得られるかどうか実験を行なった。対象とするWebコミュニティのトピックによって効果に差はあるが、いくつかのトピックについて、そのトピックの中心的なページ集合を発見することに成功している。今年度の研究発表は上述のシステムに関するものを中心に行なった。その中の「Webコミュニティにおけるコアメンバーの発見」の口頭発表に対して、2001年度人工知能学会大会優秀論文賞の受賞が決定している。また、人工知能学会誌に投稿した論文の採録も決定している。
|
Research Products
(6 results)
-
[Publications] 村田剛志: "参照の共起性に基づくWebコミュニティの発見"人工知能学会誌. Vol.16, No.3. 316-323 (2001)
-
[Publications] Tsuyoshi Murata: "A Method for Discovering Purified Web Communities"Proceedings of the Fourth International Conference on Discovery Science (DS2001), Springer. LNAI2226. 282-289 (2001)
-
[Publications] Tsuyoshi Murata: "Finding Related Web Pages Based on Connectivity Information from a Search Engine"Poster Proceedings of the 10th International World Wide Web Conference. 18-19 (2001)
-
[Publications] 村田剛志: "Webコミュニティにおけるコアメンバーの発見"人工知能学会全国大会(第15回)論文集. 3B1-03(CD-ROM). 1-2 (2001)
-
[Publications] 村田剛志: "Webコミュニティにおける構造モデル"情報処理学会研究報告. 2001-ICS-124. 41-45 (2001)
-
[Publications] 村田剛志: "Cocitation Algorithmに基づくWebコミュニティ発見"人工知能学会研究会資料. SIG-KBS-A102. 25-29 (2001)