• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

ウエブマイニングの為のウェブウェアハウス構築に関する研究

研究課題

研究課題/領域番号 13224014
研究種目

特定領域研究

配分区分補助金
審査区分 理工系
研究機関東京大学

研究代表者

喜連川 優  東京大学, 生産技術研究所, 教授 (40161509)

研究分担者 小口 正人  お茶の水女子大学, 理学部, 助教授 (60328036)
中野 美由紀  東京大学, 生産技術研究所, 助手 (30227863)
研究期間 (年度) 2001 – 2005
研究課題ステータス 完了 (2005年度)
配分額 *注記
122,100千円 (直接経費: 122,100千円)
2005年度: 28,000千円 (直接経費: 28,000千円)
2004年度: 28,000千円 (直接経費: 28,000千円)
2003年度: 32,000千円 (直接経費: 32,000千円)
2002年度: 34,100千円 (直接経費: 34,100千円)
キーワード計算機システム / インターネット高速化 / データストレージ / SAN型PCクラスタ / コンテンツアーカイブ / データマイニング / ウェブコンテンツ / ウェブリンク解析 / ディスククラスタ / コンテンツ・アーカイブ / ウェブマイニング / ウェブウェアハウス / WWW
研究概要

資源の無い我国においてはWW情報は貴重な資源と見なすことが出来、その有効活用が期待されるが現状ではWWWの利用形態は単純なキーワード転置に基づくサーチエンジンに留まっている。本研究では従来には無い新しい検索手法を模索すべく、WWWコンテンツを柔軟に操作可能とする強力なプラットフォームを構築することを目的としている。上記の目的を達成すべく、ウェブウェアハウスに適合した大規模処理システムアーキテクチャの構築、収集された大容量ウェブページの高度検索処理に適したデータ管理技法、さらにウェブウェアハウスの高次元利用を可能とするログ解析技法の三つの観点を柱に、研究を進めた。(1)ウェブウェアハウスに適合した大規模システムアーキテクチャでは、PCクラスタにSANで結合したストレージを組み合わせることにより、ウェブウェアハウスに適合したシステムアーキテクチャを提案、世界に先駆け、ストレージネットワーク型PCクラスタを構築し、有効性を実証した。(2)大容量ウェブページの高度検索処理に適したデータ管理技法に関する研究では,従来のテキスト検索とは異なるウェブページのハイパーリンク情報を基にページ間の関連を抽出するアプローチを採用し収集した全日本ウェブページのスナップショットからコミュニティチャートを作成した.また,抽出されたコミュニティチャートの部分集合を可視化し、ユーザによる閲覧・探索を支援するツールを提供した.(3)ウェブウェアハウスの高次利用を支援するログ解析技法に関する研究では、ウェブへのアクセスログを解析し,ユーザの行動意図の理解とそのシステムへの反映について検討を進め、大域的なユーザの挙動パターンの抽出に成功した。

報告書

(6件)
  • 2005 実績報告書   研究成果報告書概要
  • 2004 実績報告書
  • 2003 実績報告書
  • 2002 実績報告書
  • 2001 実績報告書
  • 研究成果

    (42件)

すべて 2006 2005 2004 2003 2002 その他

すべて 雑誌論文 (24件) 文献書誌 (18件)

  • [雑誌論文] 大規模アクセスログを用いた検索支援システム2006

    • 著者名/発表者名
      大塚真吾, 喜連川優
    • 雑誌名

      電子情報通信学会第17回データ工学ワークショップ,1B-02

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 大域ウェブアクセスログを用いた関連語の発見法に関する一考察2005

    • 著者名/発表者名
      大塚真吾, 豊田正史, 喜連川優
    • 雑誌名

      情報処理学会論文誌データベース(TOD) Vol. 46 No. SIG 8(TOD 26)

      ページ: 82-92

    • NAID

      110002768781

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] A Study for Related Words Finding Method Using Global Web Access Logs2005

    • 著者名/発表者名
      SHINGO OTSUKA, MASASHI TOYODA, MASARU KITSUREGAWA
    • 雑誌名

      TOD Vol.46, No.SIG8(TOD26)

      ページ: 82-92

    • NAID

      110002768781

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] 大域ウェブアクセスログを用いた関連語の発見に関する一考察2005

    • 著者名/発表者名
      大塚真吾, 豊田正史, 喜連川優
    • 雑誌名

      日本データベース学会Letters Vol.3, No.2

      ページ: 1-4

    • NAID

      40007013085

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 大域ウェブアクセスログを用いた関連語の発見法に関する一考察2005

    • 著者名/発表者名
      大塚真吾, 豊田正史, 喜連川優
    • 雑誌名

      情報処理学会論文誌データベース(TOD) Vol.46, No.SIG8(TOD26)

      ページ: 82-92

    • NAID

      110002768781

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 大域ウェブアクセスログを用いた検索語クラスタリング2005

    • 著者名/発表者名
      大塚真吾, 喜連川優
    • 雑誌名

      情報処理学会研究報告 Vol.2005 No.67 2005-DBS-137(I)

      ページ: 191-198

    • NAID

      110002952350

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] トレースシステムを用いたIP-SANにおけるファイル操作性能に関する解析2005

    • 著者名/発表者名
      山口実靖, 小口正人, 喜連川優
    • 雑誌名

      FIT 2005(第4回情報科学技術フォーラム)一般講演論文集第2分冊

      ページ: 85-86

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] iSCSIネットワークストレージにおけるファイルアクセス性能に関する考察2005

    • 著者名/発表者名
      山口実靖, 小口正人, 喜連川優
    • 雑誌名

      情報処理学会研究報告 2005-DBS-137(II)

      ページ: 569-574

    • NAID

      110002952400

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] ウェブコミュニティ出現におけるリンク構造成長パターン分析2005

    • 著者名/発表者名
      今藤紀子, 喜連川優
    • 雑誌名

      電子情報通信学会第16回データ工学ワークショップ(DEWS2005) 5C-o1

    • NAID

      40007013161

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Web Community Chart : a Tool for Navigating the Web and Observing its Evolution2004

    • 著者名/発表者名
      Masashi Toyoda, Masaru Kitsuregawa
    • 雑誌名

      IEICE Transactions on Information and Systems E86-D, No. 6

      ページ: 1024-1031

    • NAID

      110003213757

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] ウェブコミュニティチャート : 膨大なウェブページを関連する話題を通して閲覧可能にするツール2004

    • 著者名/発表者名
      豊田正史, 吉田聡, 喜連川優
    • 雑誌名

      電子情報通信学会論文誌 D-I Vol. J87-D-I, No.2

      ページ: 256-265

    • NAID

      110003171304

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Finding Web Communities by Maximum Flow Algorithm using Well-Assigned Edge Capacities2004

    • 著者名/発表者名
      Noriko Imafuji, Masaru Kitsuregawa
    • 雑誌名

      Web活用のための情報処理技術賞特集号(英文論文誌D) VolE87-D No. 2

      ページ: 407-415

    • NAID

      110003223363

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Web Community Chart : a Tool for Navigating Numerous Web Pages By Related Topics2004

    • 著者名/発表者名
      Masashi TOYODA, Satoshi YOSHIDA, Masaru KITSUREGAWA
    • 雑誌名

      THE IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS D-I VolJ87-D-I, No.2

      ページ: 256-265

    • NAID

      110003171304

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Finding Web Communities by Maximum Flow Algorithm using Well-Assigned Edge Capacities2004

    • 著者名/発表者名
      Noriko Imafuji, Masaru Kitsuregawa
    • 雑誌名

      The IEICE Transactions on Information and Systems announces a forthcoming section on Information Processing Technology for Web Utilization

      ページ: 407-415

    • NAID

      110003223363

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] FP-tax : Tree Structure Based Generalized Association Rule Mining2004

    • 著者名/発表者名
      Iko Pramudiono, Masaru Kitsuregawa
    • 雑誌名

      The 9th ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery (DMKD04)

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 大域ウェブアクセスログを用いたユーザ行動の分析2004

    • 著者名/発表者名
      大塚真吾, 豊田正史, 喜連川優
    • 雑誌名

      夏のデータベースワークショップDBWS2004,情報処理学会研究報告 2004-DBS-134(I)

      ページ: 17-24

    • NAID

      110003174720

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Yellow Page driven Methods of Collecting and Scoring Spatial Web Documents2004

    • 著者名/発表者名
      Takeshi Sagara, Masaru Kitsuregawa
    • 雑誌名

      Workshop on Geographic Information Retrieval SIGIR 2004

      ページ: 4-8

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Extracting User Behavior by Web Communities Technology on Global Web Logs2004

    • 著者名/発表者名
      Shingo Otsuka, Masashi Toyoda, Jun Hirai, Masaru Kitsuregawa
    • 雑誌名

      Proc.of 15th International Conference on Database and Expert Systems Applications (DEXA'2004)

      ページ: 957-968

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 大域ウェブアクセスログを用いた関連語の発見に関する一考察2004

    • 著者名/発表者名
      大塚真吾, 豊田正史, 喜連川優
    • 雑誌名

      日本データベース学会(DBSJ) Letters Vol.3, No.2

      ページ: 1-4

    • NAID

      40007013085

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Webコミュニティを用いた大域Webアクセスログ解析法の一提案2003

    • 著者名/発表者名
      大塚真吾, 豊田正史, 喜連川優
    • 雑誌名

      情報処理学会論文誌 : データベース(IPSJ TODS) Vol.44, No.SIG13

      ページ: 32-44

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] A Study for Analysis of Web Access Logs with Web Communities2003

    • 著者名/発表者名
      SHINGO OTSUKA, MASASHI TOYODA, MASARU KITSUREGAWA
    • 雑誌名

      IPSJ TOD Vol.44, No.SIG13(TOD20)

      ページ: 32-44

    • NAID

      110002712014

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Web Community Chart : a Tool for Navigating the Web and Observing its Evaluation2003

    • 著者名/発表者名
      Masashi Toyoda, Masaru Kitsuregawa
    • 雑誌名

      IEICE Transactions on Information and Systems E86-D, NO.6

      ページ: 1024-1031

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Runtime Data Declustering over SAN-Connected PC Cluster System2002

    • 著者名/発表者名
      Masato Oguchi, Masaru Kitsuregawa
    • 雑誌名

      Poster paper, IEEE International Conference on Data Enginee ring (ICDE 2002)

      ページ: 275-275

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Runtime Data Declustering over SAN-Connected PC Cluster System2002

    • 著者名/発表者名
      Masato oguchi, Masaru Kitsuregawa
    • 雑誌名

      Proceedings of 18th IEEE Int'l Conference on Data Engineering (ICDE2002)

      ページ: 275-275

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [文献書誌] Noriko Imafuji, Masaro Kitsuregawa: "Finding Web Communities by Maximum Flow Algorithm using Well-Assigned Edge Capacity"電子情報通信学会英文論文誌D. Vol.87-D, No.2. 407-415 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 大塚真吾, 豊田正史, 喜連川優: "Webコミュニティを用いた大域Webアクセスログ解析法の一提案"情報処理学会論文誌:データベース(IPSJ TOD). Vol.44,No.SIG13(TOD20). 32-44 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Noriko Imafuji, Masaru Kitsuregawa: "Finding a Web Community by Maximum Flow Algorithm with HITS Score Based Capacity"Proceedings of 8^<th> International Conference on Database Systems for Advanced Applications(DASFAA2003). 101-106 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Iko Pamudiono, Masaru Kitsuregawa: "Tree Structure based Parallel Grequent Pattern Mining on PC Cluster"Proceedings of 14^<th> International Conference on Database and Expert Systems Applications(DEXA2003). 537-544 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Masaru Kitsuregawa, Iko Pramudiono: "PC Cluster Based Parallel Frequent Pattern Mining and Parallel Web Access Pattern Miming"Proceedings of Third International Workshop on Databases in Networked Information Systems(DNIS2003). 172-17 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] イコプラムディオノ, 喜連川 優: "Fp-growthの無共有並列実行:Shared Nothing Parallel Execution of FP-growth"日本データベース学会Letters (DBSJ Letters). Vol.2,No.1. 43-46 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Bowo Prasetyo, Masaru Kitsuregawa, et al.: "Naviz : Website Navigational Behavior Visualizer"Proc. of 6th Pacific-Asia Conference on Advances in Knowledge Discovery and Data Mining(PAKDD 2002). (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Yusuke Ohura, Masaru Kitsuregawa, et al.: "Experiments on Query Expansion for Internet Yellow Page Services Using Web Log Mining"28th International Conference on Very Large Data Bases(VLDB 2002). (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Wang Y., Kitsuregawa M.: "On Combining Link and Contents Information for Web Page Clustering"Proc. of DEXA2002. (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Masato Oguchi, Masaru Kitsuregawa: "Runtime Data Declustering based on Bandwidth-on-Deamand and its Evaluation over SAN-connected PC Cluster"Proc. of 15th International Conference on Parallel and Distributed Computing Systems(PDCS 2002). 206-213 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Noriko Imafuji, Masaru Kitsuregawa: "Effects of Maximum Flow Algorithm on Idetifying Web Community"Proc. of 4th International Workshop on Web Information and Data Management(WIDM 2002). 43-48 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Masashi Toyoda, Masaru Kitsuregawa: "Observing Evolution of Web Community"Proceedings of 11th International WWW Conference(poster). (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Masato Oguchi, Masaru Kitsuregawa: "Data Mining on PC Cluster connected with Storage Area Network : Its Preliminary Experimental Results"IEEE International Conference on Communications (JCC2001), G51b.1. (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] Yitong Wang, Masaru Kitsuregawa: "Link Based Clustering of Web Search Results"Advances in Web-Age Information Management Second International Conference, (WAIM2001), Springer (Lecture Notes in Computer Science). 2118. 225-236 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] Masato Oguchi, Masaru Kitsuregawa: "Implementation and Evaluation of Parallel Data Mining on PC Cluster and Optimization of its Execution Environments"International Conference on Advances in Infrastructure for Electronic Business, Science, and Education on the Internet (SS-GRR2001). 116. (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] Masashi Toyoda, Masaru Kitsuregawa: "Creating a Web Community Chart for Navigating Related Communities"Conference Proceedings of Hypertext 2001. 103-112 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] P.Krishna Reddy, Masaru Kitsuregawa: "An approach to relate the web communities through bipartite graphs"Proceedings of The 2nd International Conference on Web Information Systems Engineering, IEEE Computer Society. (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] Yitong Wang, Masaru Kitsuregawa: "Use link-based Clustering to Improve Search Resutls"Proceedings of the 2nd International Conference on Web Information Systems Engineering, IEEE Computer Society. (2001)

    • 関連する報告書
      2001 実績報告書

URL: 

公開日: 2002-04-01   更新日: 2018-03-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi