2003 Fiscal Year Annual Research Report
ウェブマイニングの為のウェブウェアハウス構築に関する研究
Project/Area Number |
13224014
|
Research Institution | The University of Tokyo |
Principal Investigator |
喜連川 優 東京大学, 生産技術研究所, 教授 (40161509)
|
Co-Investigator(Kenkyū-buntansha) |
中野 美由紀 東京大学, 生産技術研究所, 助手 (30227863)
小口 正人 お茶の水女子大学, 理学部, 助教授 (60328036)
|
Keywords | 計算機システム / インターネット高速化 / データストレージ / ディスククラスタ / コンテンツアーカイブ / データマイニング |
Research Abstract |
資源の無い我国においては情報は貴重な資源と見なすことが出来、その有効活用が期待されるが現状ではWWWの利用形態は単純なキーワードサーチに基づくサーチエンジンに留まっている。本研究では更なる新しいサービスを模索すべく、その第一歩としてコンテンツを柔軟に操作可能とする強力なプラットフォームを構築することを目的としている。本年度は、WWWページ間のリンクグラフから最大流アルゴリズムをベースとしたウェブコミュニティの抽出方式について検討を行い、従来のエッジ固定とは異なるHITSスコアに基づく可変辺容量設定方式を提案し、今までに収集した数年間の全日本WWWページ情報から作成されたグラフを用いて、提案する方式の有効性を確認した。また、WWWページ間リンク構造からWWWコミュニティを抽出する手法を提案しているが、この手法を用いて新たにウェブページを閲覧する人々のアクセスログ解析を行い、いわゆる従来の特定のサイト毎のログ解析とは異なるWWWページ空間全体にまたがる大域的なユーザ行動パターンの抽出を行い、今までは捉えることの出来なかったWWW上のアクセス行動における知見を得ることができた。
|
-
[Publications] Noriko Imafuji, Masaro Kitsuregawa: "Finding Web Communities by Maximum Flow Algorithm using Well-Assigned Edge Capacity"電子情報通信学会英文論文誌D. Vol.87-D, No.2. 407-415 (2004)
-
[Publications] 大塚真吾, 豊田正史, 喜連川優: "Webコミュニティを用いた大域Webアクセスログ解析法の一提案"情報処理学会論文誌:データベース(IPSJ TOD). Vol.44,No.SIG13(TOD20). 32-44 (2003)
-
[Publications] Noriko Imafuji, Masaru Kitsuregawa: "Finding a Web Community by Maximum Flow Algorithm with HITS Score Based Capacity"Proceedings of 8^<th> International Conference on Database Systems for Advanced Applications(DASFAA2003). 101-106 (2003)
-
[Publications] Iko Pamudiono, Masaru Kitsuregawa: "Tree Structure based Parallel Grequent Pattern Mining on PC Cluster"Proceedings of 14^<th> International Conference on Database and Expert Systems Applications(DEXA2003). 537-544 (2003)
-
[Publications] Masaru Kitsuregawa, Iko Pramudiono: "PC Cluster Based Parallel Frequent Pattern Mining and Parallel Web Access Pattern Miming"Proceedings of Third International Workshop on Databases in Networked Information Systems(DNIS2003). 172-17 (2003)
-
[Publications] イコプラムディオノ, 喜連川 優: "Fp-growthの無共有並列実行:Shared Nothing Parallel Execution of FP-growth"日本データベース学会Letters (DBSJ Letters). Vol.2,No.1. 43-46 (2003)