• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2007 Fiscal Year Annual Research Report

Webテキストからの知識抽出支援システムに関する研究

Research Project

Project/Area Number 17200007
Research InstitutionThe University of Tokyo

Principal Investigator

中川 裕志  The University of Tokyo, 情報基盤センター, 教授 (20134893)

Co-Investigator(Kenkyū-buntansha) 米澤 明憲  東京大学, 情報理工学系研究科, 教授 (00133116)
田浦 健次朗  東京大学, 情報理工学系研究科, 教授 (90282714)
二宮 崇  東京大学, 情報基盤センター, 教授 (20444094)
吉田 稔  東京大学, 情報基盤センター, 教授 (40361688)
清田 陽司  東京大学, 情報基盤センター, 教授 (10401316)
KeywordsWWW / 知識 / テキスト / マイニング / 用例検索 / 名寄せ / 用語抽出 / 機械学習
Research Abstract

本研究においては,膨大な量のWebページから,利用者が興味を持つ分野の知識を記述するテキストを抽出し表示するシステムを開発した。具体的には,以下のようなシステムを提案しプロトタイプおよび実用的なシステムを開発した。(1)既開発の用語抽出システム「言選Web」を用いて,そのページを特徴つける重要語を抽出し,その定義,あるいは複数の重要語の間の関係を知ることを目的とし,Webからの用例検索システムKiwiを利用して,それらの重要語を含む用例文を多数抽出するシステムを開発した。Webを直接に検索する従来の用例検索システムを,高速化するために,既存クローラで収集したWebページを対象にする新たな用例検索システムを開発し,UT-Kiwiとして公開した。(2)上記の用例検索の精度の向上を目的とし,同一名が異なる実体を参照する場合,別名が同一実体を参照する場合を解消するWeb名寄せのメカニズムを提案し,試作システムNayoseを構築し性能改善を行った。(3)Webテキスト情報からの知識抽出の基礎となる機械学習アルゴリズムを開発した。(4)Webテキストの活用を狙って,Web上の英文テキストから穴埋め4択問題を自動生成するシステムSakumonを開発した。

  • Research Products

    (11 results)

All 2008 2007 Other

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (8 results) Remarks (1 results)

  • [Journal Article] Semi-structure Mining Method for Text Mining with a Chunk-based Dependency Structure2007

    • Author(s)
      Issei Sato, Hiroshi Nakagawa
    • Journal Title

      Springer LNAI 4426

      Pages: 777-784

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] Dirichlet Process Unigram Mixture Modelに対するCollapsed変分ベイズ法の適用2007

    • Author(s)
      佐藤 一誠, 中川 裕志
    • Journal Title

      情報処理学会論文誌 48 TOM19

      Pages: 107-116

    • Peer Reviewed
  • [Presentation] Gram-Free Synonym Extraction via Suffix Arrays2008

    • Author(s)
      Minoru Yoshida, Hiroshi Nakagawa.
    • Organizer
      AIRS2008(Asia Information Retrieval Symposium 2008)
    • Place of Presentation
      Harbin,China
    • Year and Date
      20080115-18
  • [Presentation] Web Document Parsing:A New Approach to Modehng Layout-Language Relations2007

    • Author(s)
      Minoru Yoshida, Hirroshi Nakkagawa
    • Organizer
      ICDAR2007 (The 9th International Conference on Document Analysis and Recognition)
    • Place of Presentation
      Curitiba,Bfazil
    • Year and Date
      20070923-26
  • [Presentation] Knowledge Discovery of Multiple-topic Document using Parametric Mixture Model with Dirichlet Prior2007

    • Author(s)
      Issei Sato, Hiroshi Nakagawa.
    • Organizer
      Thirteenth ACM SIGKDD
    • Place of Presentation
      SanJose,USA
    • Year and Date
      20070815-18
  • [Presentation] A Cloze Test Authoring System and its Automation2007

    • Author(s)
      Ayako Hoshino, Hiroshi Nakagawa
    • Organizer
      ICWL2007-The 6th International Conference on Web-based Learning
    • Place of Presentation
      Edingburgh,Scotland
    • Year and Date
      20070815-17
  • [Presentation] Cross-Lingual Concern Analysisi from Multiingual Weblog Articles2007

    • Author(s)
      Tomohiro Fukuhara, Takehito Utsuro, Hiroshi Nakagawa
    • Organizer
      The 6th International Workshop on Social Intelligence Design(SID 2007)
    • Place of Presentation
      Trent,Italy
    • Year and Date
      20070702-04
  • [Presentation] Bayesian Document Generative Model with Explicit Multiple Topics2007

    • Author(s)
      Issei, Sato, Hiroshi Nakagawa
    • Organizer
      EMNLP-CoNLL2007
    • Place of Presentation
      Prague,Czech
    • Year and Date
      20070625-28
  • [Presentation] Structural Correspondence Learning for Dependency Parsing2007

    • Author(s)
      Nobuyuki Shimizu, Hiroshi Nakagawa
    • Organizer
      EMNLP-CoNLL-ST
    • Place of Presentation
      Prague,Czech
    • Year and Date
      20070625-28
  • [Presentation] Semi-structure Mining Method for Text Mining with a Chunk-based Dependency Structure2007

    • Author(s)
      Issei Sato, Hiroshi Nakagawa.
    • Organizer
      PAKDD'07(The 11th Pacific-Asia Conference on Knowledge Discovery and Data Mining)
    • Place of Presentation
      Nanjin,China
    • Year and Date
      20070522-25
  • [Remarks] UT-Kiwi

    • URL

      http://kiwi.r.dl.itc.u-tokyo.ac.jp/ut-kiwi/

URL: 

Published: 2010-02-04   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi