• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

Webのハイパーリンク構造のモデル化に関する研究

研究課題

研究課題/領域番号 16680008
研究種目

若手研究(A)

配分区分補助金
研究分野 知能情報学
研究機関東京工業大学 (2005-2006)
国立情報学研究所 (2004)

研究代表者

村田 剛志  東京工業大学, 大学院情報理工学研究科, 助教授 (90242289)

研究期間 (年度) 2004 – 2006
研究課題ステータス 完了 (2006年度)
配分額 *注記
20,410千円 (直接経費: 15,700千円、間接経費: 4,710千円)
2006年度: 7,540千円 (直接経費: 5,800千円、間接経費: 1,740千円)
2005年度: 5,720千円 (直接経費: 4,400千円、間接経費: 1,320千円)
2004年度: 7,150千円 (直接経費: 5,500千円、間接経費: 1,650千円)
キーワードWebマイニング / ハイパーリンク / 視聴行動ローデータ / PageRank / 視覚化 / インターネット高度化 / 人工知能 / 機械学習 / Webコミュニティ / ディレクトリ・情報検索 / Web構造マイニング
研究概要

本研究代表者はハイパーリンク等のグラフ構造に基づいてWebページ等の対象間の関連性を見出すWebマイニングの研究を進めてきている。Webページの多くは、関連するページへのハイパーリンクを有しており、Webコミュニティと呼ばれるグラフ構造を構成している。このような密な部分構造についての知見を得ることは、Webから効率的な情報収集をする上で重要である。
本年度においては、ユーザの振る舞いをログデータから理解するための試みとして、ログデータから得られるグラフ構造をもとに、関心サイト集合を抽出し視覚化する手法を考案し実験を行なった。対象とするログデータとして、クライアント側から得られるインターネット視聴行動のローデータを用いた。このデータには、ユーザが訪問したサイトおよび検索で入力したキーワードが含まれている。特定のユーザのローデータから、サイトやキーワードを頂点とし、時間的な前後関係を辺としたグラフ(サイト・キーワードグラフ)を生成した。このサイト・キーワードグラフから中心的な部分グラフを抽出することで、対象ユーザの関心を見出すことができる。2004年12月の1ヶ月間における8,000人以上のユーザについてローデータを用いて実験を行ったところ、もとのサイト・キーワードグラフの30パーセント程度の中心的な部分グラフを抽出した。それをGraphvizによって視覚化することで、抽出された部分グラフの分析も行った。ハイパーリンクによって結合したWebページのグラフ構造に対して適用するランキングやコミュニティ発見の手法は、主としてWeb構造マイニングの手法であるが、ログデータの分析に対してもそのような手法が有効であることを示すことができた。

報告書

(3件)
  • 2006 実績報告書
  • 2005 実績報告書
  • 2004 実績報告書
  • 研究成果

    (9件)

すべて 2006 2005 2004

すべて 雑誌論文 (7件) 図書 (2件)

  • [雑誌論文] Web視聴率データからのユーザコミュニティの発見2006

    • 著者名/発表者名
      村田剛志
    • 雑誌名

      知能と情報 Vol. 18, No. 2

      ページ: 213-222

    • NAID

      110004729024

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] サイト・キーワードグラフを用いたWebユーザの興味の抽出と視覚化2006

    • 著者名/発表者名
      村田剛志, 齋藤皓太
    • 雑誌名

      知能と情報 Vol. 18, No. 5

      ページ: 701-710

    • NAID

      110004821176

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Extracting User's Interests from Web Log Data2006

    • 著者名/発表者名
      Tsuyoshi Murata, Kota Saito
    • 雑誌名

      Proceedings of the 2006 IEEE/WIC/ACM Int' l Conf. on Web In telligence and Intelligent Technology (WI2006)

      ページ: 343-346

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 検索エンジン2005-Webの道しるべ-2005

    • 著者名/発表者名
      村田剛志(編)
    • 雑誌名

      情報処理学会誌 Vol.46,No.9

      ページ: 979-1015

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Extraction of Structural information from the Web2005

    • 著者名/発表者名
      T.Murata
    • 雑誌名

      Proceedings of the Second international Conference on Fuzzy Systems and Knowledge Discovery (FSKD2005) LNAI3614

      ページ: 1204-1207

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Discovery of Web User Communities from Client-level Log Data2004

    • 著者名/発表者名
      T.Murata
    • 雑誌名

      Proceedings of the Third International Workshop on Social Intelligence Desin (SID 2004)

      ページ: 111-118

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Roles of Diagrammatic Information for the Discovery of Geometrical Theorems2004

    • 著者名/発表者名
      T.Murata
    • 雑誌名

      Proceedings of the Third International Conference on the Theory and Application of Diagrams (Diagrams 2004), LNAI2980

      ページ: 235-238

    • 関連する報告書
      2004 実績報告書
  • [図書] Graph Mining Approaches for the Discovery of Web Communities(T.Washio, J.N.Kok, L.D.Raedt eds.)Advances in Mining Graphs, Trees And Sequences2005

    • 著者名/発表者名
      T.Murata
    • 出版者
      IOS Press
    • 関連する報告書
      2005 実績報告書
  • [図書] Graph Mining Approaches for the Discovery of Web Communities (in L.D.Raedt, T.Washio, J.N.Kok(Eds.)) "Mining Graphs, Trees and Sequences"2005

    • 著者名/発表者名
      T.Murata
    • 出版者
      IOS Press(印刷中)
    • 関連する報告書
      2004 実績報告書

URL: 

公開日: 2004-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi