• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2008 Fiscal Year Annual Research Report

統計モデリングとデータマイニングに基づくネットワーク化知識の創出と活用

Research Project

Project/Area Number 20300038
Research InstitutionKobe University

Principal Investigator

江口 浩二  Kobe University, 工学研究科, 准教授 (50321576)

Co-Investigator(Kenkyū-buntansha) 高須 淳宏  国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)
大川 剛直  神戸大学, 工学研究科, 教授 (30223738)
尾崎 知伸  神戸大学, 自然科学系先端融合研究環重点研究部, 助教 (40365458)
Keywords統計モデリング / データマイニング / 確率的生成モデル / 確率的トピックモデル / 確率的言語モデル / 情報検索 / グラフマイニング / 複雑ネットワーク分析
Research Abstract

本課題は、統計モデリング技術とデータマイニング技術を駆使・拡張し、断片的に散在した情報コンテンヅから、人間の知的活動に直接活用可能なネヅトワーク化知識を創出し、活用する手段の確立をめざす。この目的のもと、平成20年度は、以下の研究項目に取り組んだ。
1.複数のタグで構造化された文書においてタグ間の依存関係を反映しつつ潜在的な話題構造を表現する多型トピックモデルを開発し、それをギブスサンプリング法により推定することによって、テキストデータからの社会ネヅトワーク抽出、および、構造化文書検索などの応用を実現した。
2.学術文献における専門用語間の関係性を定量化する問題において、潜在トピックに着目し、そのモデル化方法、推定方法、語間類似度の計算方法、および、トピック数による性能の違いを明らかにした。
3.部分的に観測されるネットワーク構造から潜在的な頂点グループを統計的に推定し、それを用いて未観測のリンクを予測する手法を開発した。現実の社会ネットワーク(共著ネットワーク)および生物学的ネットワーク(代謝ネットワーク)を用いた評価実験において優れた有効性を実現した。
4.頂点に構造をもつグラフ(複合構造グラフ)を対象とした、効率的な特徴的パターン発見システムを実現した。また、各属性が構造データで表現される多次元構造データベースを対象に、集合内の各要素が相互に依存するようなパターンの集合を獲得するアルゴリズムの開発に成功した。

  • Research Products

    (24 results)

All 2009 2008 Other

All Journal Article (17 results) (of which Peer Reviewed: 17 results) Presentation (6 results) Remarks (1 results)

  • [Journal Article] 多型トピックモデルを用いたアノテーシヨン付き文書に対する検索手法2009

    • Author(s)
      江口浩二, 塩崎仁博
    • Journal Title

      電子情報通信学会論文誌 Vol. J92-D, No. 3

      Pages: 311-320

    • Peer Reviewed
  • [Journal Article] 複製文字列検知に基づいたSplogフィルタリング手法2009

    • Author(s)
      竹田隆治, 高須淳宏
    • Journal Title

      情報処理学会論文誌 データベース Vol. 2, No. 1

      Pages: 93-103

    • Peer Reviewed
  • [Journal Article] Entity Network Prediction using Multitype Topic Models2008

    • Author(s)
      Hitohiro Shiozaki, Koji Eguchi, Takenao Ohkawa
    • Journal Title

      Advances in Knowledge Discovery and Data Mining : 12th Pacific-Asia Conference, PAKDD 2008 Vol. LNCS-5012

      Pages: 705-714

    • Peer Reviewed
  • [Journal Article] Entity Ranking from Annotated Text Collections using Multitype Topic Models2008

    • Author(s)
      Hitohiro Shiozaki, Koji Eguchi
    • Journal Title

      Focused Access to XML Documents : 6th International Workshop of the Initiative for the Evaluation of XML Retrieval, INEX 2007 Vol. LNCS-4862

      Pages: 279-292

    • Peer Reviewed
  • [Journal Article] Predicting Protein-Protein Relationships from Literature using Collapsed VariationaI Latent Dirichlet Allocation2008

    • Author(s)
      Tatsuya Asou, Koji Eguchi
    • Journal Title

      Proceedings of the 2nd International Workshop on Dataand Text Mining in Bioinformatics

      Pages: 77-80

    • Peer Reviewed
  • [Journal Article] Automatic Query Structuring from Sentences for Japanese Web Retrieval2008

    • Author(s)
      Tetsuya Shibata, Koii Eguchi
    • Journal Title

      Proceedings of the 2nd ACM Workshop on Improving Non-English Web Searching

      Pages: 55-62

    • Peer Reviewed
  • [Journal Article] Entity Network Prediction using Multitype Topic Models2008

    • Author(s)
      Hitohiro Shiozaki, Koji Eguchi, Takenao Ohkawa
    • Journal Title

      正ICE Transactions on Information and Systems Vol. E91-D, No. 11

      Pages: 2589-2598

    • Peer Reviewed
  • [Journal Article] Improving Document Representation for Story Link Detection by Modeling Term Topicality2008

    • Author(s)
      Chi rag Shah, Koji Eguchi
    • Journal Title

      IPSJ Transactions on Databases Vol. 1, No. 3

      Pages: 11-19

    • Peer Reviewed
  • [Journal Article] Link Prediction in Metabolic Networks using Topology-based Mixture Models2008

    • Author(s)
      Akira Ninagawa, Koji Eguchi
    • Journal Title

      Proceedings of the 19th International Conference on Genome Informatics (CD-ROM)

      Pages: 1-2

    • Peer Reviewed
  • [Journal Article] Information Extraction by Two Dimensional Parser2008

    • Author(s)
      Atsuhiro Takasu
    • Journal Title

      Proceedings of the 20th IEEE International Conference on Tools with Artificial Intelligence

      Pages: 333-340

    • Peer Reviewed
  • [Journal Article] 構造データ集合からなるグラフデータベースからの頻出パターン発見2008

    • Author(s)
      山本翼, 尾崎知伸, 大川剛直
    • Journal Title

      情報処理学会論文誌 : データベース Vol. 1, No. 1

      Pages: 26-35

    • Peer Reviewed
  • [Journal Article] グラフデータベースからの頻出相互関連部分グラフ集合の発見2008

    • Author(s)
      尾崎知伸, 大川剛直
    • Journal Title

      人工知能学会論文誌 Vol. 23, No. 6

      Pages: 514-525

    • Peer Reviewed
  • [Journal Article] 拡張出現マッチングを用いた制約付きノイズ許容極小順序木パターンの発見2008

    • Author(s)
      尾崎知伸, 大川剛直
    • Journal Title

      情報処理学会論文誌 : データベース Vol. 1, No. 3

      Pages: 20-35

    • Peer Reviewed
  • [Journal Article] Mining Correlated Subgraphs in Graph Databases2008

    • Author(s)
      Tomonobu Ozaki, Takenao Ohkawa
    • Journal Title

      Advances in Knowledge Discovery and Data Mining : 12th Pacific-Asia Conference, PAKDD 2008 Vol. LNCS-5012

      Pages: 272-283

    • Peer Reviewed
  • [Journal Article] Mining Mutually Dependent Ordered Subtrees in Tree Database2008

    • Author(s)
      Tomonobu Ozaki, Takenao Ohkawa
    • Journal Title

      New Frontiers in Applied Data Mining : PAKDD 2008 International Workshops

      Pages: 75-86

    • Peer Reviewed
  • [Journal Article] Mining Correlated Pairs of Patterns in Multidimensional Structured Databases2008

    • Author(s)
      Tomonobu Ozaki, Takenao Ohakawa
    • Journal Title

      Proceedings of the 2008 IEEE International Conferenceon Data Mining Workshops

      Pages: 275-282

    • Peer Reviewed
  • [Journal Article] Discovery of Internal and External Hyperclique Patterns in Complex Graph Databases2008

    • Author(s)
      Tsubasa Yamamoto, Tomonobu Ozaki, Takenao Ohkawa
    • Journal Title

      Proceedings of the 2008 IEEE International Conference on Data Mining Workshops

      Pages: 301-309

    • Peer Reviewed
  • [Presentation] 多重トピックを用いたブログ空間の情報伝搬解析2009

    • Author(s)
      横山正太朗, 江口浩二, 大川剛直
    • Organizer
      情報処理学会第190回自然言語処理研究会
    • Place of Presentation
      東京都文京区
    • Year and Date
      2009-03-26
  • [Presentation] 多型トピックモデルを用いたWikipeclia検索2009

    • Author(s)
      江口浩二, 塩崎仁博
    • Organizer
      人工知能学会第20回セマンティックウェブとオントロジー研究会・Wikipediaワークショップ
    • Place of Presentation
      東京都文京区
    • Year and Date
      2009-01-22
  • [Presentation] 情報コンテンツからの社会ネットワーク構造の抽出と活用2008

    • Author(s)
      江口浩二
    • Organizer
      日本学術振興会光ネットワークシステム技術第171委貝会第33回研究会
    • Place of Presentation
      兵庫県神戸市
    • Year and Date
      2008-07-28
  • [Presentation] 多重多型トピックモデルを用いたアノテーシヨン付きテキストからのエンティティ検索2008

    • Author(s)
      江口浩二, 塩崎仁博
    • Organizer
      情報処理学会第145回データベースシステム研究会・第91回情報学基礎研究会
    • Place of Presentation
      北海道小樽市
    • Year and Date
      2008-06-20
  • [Presentation] 自然言語文からの構造化クェリの自動生成によるWeb情報検索2008

    • Author(s)
      柴田鉄也, 江口浩二
    • Organizer
      情報処理学会第145回データベースシステム研究会・第91回情報学基礎研究会
    • Place of Presentation
      北海道小樽市
    • Year and Date
      2008-06-19
  • [Presentation] Collapsed変分ベイズLDAによるタンパク質相互作用予測2008

    • Author(s)
      麻生竜矢, 江口浩二
    • Organizer
      情報処理学会第145回データベースシステム研究会・第91回情報学基礎研究会
    • Place of Presentation
      北海道小樽市
    • Year and Date
      2008-06-19
  • [Remarks]

    • URL

      http://www.prmir.scitec.kobe-u.ac.jp/

URL: 

Published: 2010-06-11   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi