• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Webのハイパーリンク構造のモデル化に関する研究

Research Project

Project/Area Number 16680008
Research Category

Grant-in-Aid for Young Scientists (A)

Allocation TypeSingle-year Grants
Research Field Intelligent informatics
Research InstitutionTokyo Institute of Technology (2005-2006)
National Institute of Informatics (2004)

Principal Investigator

村田 剛志  東京工業大学, 大学院情報理工学研究科, 助教授 (90242289)

Project Period (FY) 2004 – 2006
Project Status Completed (Fiscal Year 2006)
Budget Amount *help
¥20,410,000 (Direct Cost: ¥15,700,000、Indirect Cost: ¥4,710,000)
Fiscal Year 2006: ¥7,540,000 (Direct Cost: ¥5,800,000、Indirect Cost: ¥1,740,000)
Fiscal Year 2005: ¥5,720,000 (Direct Cost: ¥4,400,000、Indirect Cost: ¥1,320,000)
Fiscal Year 2004: ¥7,150,000 (Direct Cost: ¥5,500,000、Indirect Cost: ¥1,650,000)
KeywordsWebマイニング / ハイパーリンク / 視聴行動ローデータ / PageRank / 視覚化 / インターネット高度化 / 人工知能 / 機械学習 / Webコミュニティ / ディレクトリ・情報検索 / Web構造マイニング
Research Abstract

本研究代表者はハイパーリンク等のグラフ構造に基づいてWebページ等の対象間の関連性を見出すWebマイニングの研究を進めてきている。Webページの多くは、関連するページへのハイパーリンクを有しており、Webコミュニティと呼ばれるグラフ構造を構成している。このような密な部分構造についての知見を得ることは、Webから効率的な情報収集をする上で重要である。
本年度においては、ユーザの振る舞いをログデータから理解するための試みとして、ログデータから得られるグラフ構造をもとに、関心サイト集合を抽出し視覚化する手法を考案し実験を行なった。対象とするログデータとして、クライアント側から得られるインターネット視聴行動のローデータを用いた。このデータには、ユーザが訪問したサイトおよび検索で入力したキーワードが含まれている。特定のユーザのローデータから、サイトやキーワードを頂点とし、時間的な前後関係を辺としたグラフ(サイト・キーワードグラフ)を生成した。このサイト・キーワードグラフから中心的な部分グラフを抽出することで、対象ユーザの関心を見出すことができる。2004年12月の1ヶ月間における8,000人以上のユーザについてローデータを用いて実験を行ったところ、もとのサイト・キーワードグラフの30パーセント程度の中心的な部分グラフを抽出した。それをGraphvizによって視覚化することで、抽出された部分グラフの分析も行った。ハイパーリンクによって結合したWebページのグラフ構造に対して適用するランキングやコミュニティ発見の手法は、主としてWeb構造マイニングの手法であるが、ログデータの分析に対してもそのような手法が有効であることを示すことができた。

Report

(3 results)
  • 2006 Annual Research Report
  • 2005 Annual Research Report
  • 2004 Annual Research Report
  • Research Products

    (9 results)

All 2006 2005 2004

All Journal Article (7 results) Book (2 results)

  • [Journal Article] Web視聴率データからのユーザコミュニティの発見2006

    • Author(s)
      村田剛志
    • Journal Title

      知能と情報 Vol. 18, No. 2

      Pages: 213-222

    • NAID

      110004729024

    • Related Report
      2006 Annual Research Report
  • [Journal Article] サイト・キーワードグラフを用いたWebユーザの興味の抽出と視覚化2006

    • Author(s)
      村田剛志, 齋藤皓太
    • Journal Title

      知能と情報 Vol. 18, No. 5

      Pages: 701-710

    • NAID

      110004821176

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Extracting User's Interests from Web Log Data2006

    • Author(s)
      Tsuyoshi Murata, Kota Saito
    • Journal Title

      Proceedings of the 2006 IEEE/WIC/ACM Int' l Conf. on Web In telligence and Intelligent Technology (WI2006)

      Pages: 343-346

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 検索エンジン2005-Webの道しるべ-2005

    • Author(s)
      村田剛志(編)
    • Journal Title

      情報処理学会誌 Vol.46,No.9

      Pages: 979-1015

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Extraction of Structural information from the Web2005

    • Author(s)
      T.Murata
    • Journal Title

      Proceedings of the Second international Conference on Fuzzy Systems and Knowledge Discovery (FSKD2005) LNAI3614

      Pages: 1204-1207

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Discovery of Web User Communities from Client-level Log Data2004

    • Author(s)
      T.Murata
    • Journal Title

      Proceedings of the Third International Workshop on Social Intelligence Desin (SID 2004)

      Pages: 111-118

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Roles of Diagrammatic Information for the Discovery of Geometrical Theorems2004

    • Author(s)
      T.Murata
    • Journal Title

      Proceedings of the Third International Conference on the Theory and Application of Diagrams (Diagrams 2004), LNAI2980

      Pages: 235-238

    • Related Report
      2004 Annual Research Report
  • [Book] Graph Mining Approaches for the Discovery of Web Communities(T.Washio, J.N.Kok, L.D.Raedt eds.)Advances in Mining Graphs, Trees And Sequences2005

    • Author(s)
      T.Murata
    • Publisher
      IOS Press
    • Related Report
      2005 Annual Research Report
  • [Book] Graph Mining Approaches for the Discovery of Web Communities (in L.D.Raedt, T.Washio, J.N.Kok(Eds.)) "Mining Graphs, Trees and Sequences"2005

    • Author(s)
      T.Murata
    • Publisher
      IOS Press(印刷中)
    • Related Report
      2004 Annual Research Report

URL: 

Published: 2004-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi