• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Annual Research Report

テキスト中のエンティティ間関係に注目するウェブ知能化

Research Project

Project/Area Number 23300052
Research InstitutionThe University of Tokyo

Principal Investigator

石塚 満  東京大学, 大学院・情報理工学系研究科, 教授 (50114369)

KeywordsWebインテリジェンス / 関係検索 / テキスト含意認識 / 概念意味表現言語 / 意味計算基盤 / 意味役割認識 / 談話関係 / 関係類似性
Research Abstract

Webテキスト情報のエンティティ間の関係に注目したWeb知能化に向けた研究開発を行った.その一つが潜在関係検索エンジンの開発であり,これは{(Japan, Mt.Fuji)(Germany, ?)}といったクエリーに対し,{?=Zugspitze}といった検索結果をランキングと証拠文付きで返す.数秒で結果を返す必要性から,事前にインデックス化を行っている.全ての英文Wikipedia中の固有名詞エンティティ・ペアについてインデックス化を行っており,670万のエンティティ,3000万のエンティティ・ペアをインデックス化している.これによって,固有名詞のペアというように検索範囲には限定があるものの,世界でも非常にユニークな関係検索エンジンを,一般にも使用できる形で実現した.今後に向けて,言語横断検索,否定文の処置法,証拠文のランキング機能,固有名詞以外への拡張法についても研究した.
文間の関係の中では,特にテキスト含意認識(Text Entailment Recognition)について研究し,WordNetでの語彙の類似性を利用する新しい含意判定法について成果を得た.この中途段階のシステムをもって2011年11月に米国NISTで行われたRecognizing Textual Entailment Challenge(RTE-7)コンテストに参加し,世界第2位を獲得した.
個別言語独立でコンピュータにも意味が把握できる共通的な概念記述言語CDL(Concept Description Language)に関しては,語義曖昧性解消によるテキストからCDLへの半自動変換法,CDLデータの効率的な意味的検索の実現法について研究を進めた.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

潜在関係検索エンジンについては,全ての英文Wikipedia中の固有名詞エンティティ・ペアについてインデックス化を行っており,670万のエンティティ,3000万のエンティティ・ペアをインデックス化し,数秒で検索可能にした.この日英の言語横断検索もほぼ実現している.文間の関係の一種であるテキスト含意認識について,世界コンテストで第2位を得るような成果を挙げた.概念記述言語CDL(Concept Description Language)については,特にCDLデータの効率的な意味的検索法を開発した.

Strategy for Future Research Activity

(i)潜在的検索エンジンについては,現在固有名詞ペアに限っている対象を,一部一般名詞も含めるようにする,否定文処理機能の導入による精度向上を図る,等の機能拡張を行う.
(ii)逐次共クラスタリングについては,片側のエンティティを固定し,関連する全ての関係を抽出するセミ・オープン関係抽出に適応し,効果を実証する.
(iii)CDLについては,自然言語テキストからCDLの半自動変換の機能向上を継続して行う.並行してWikipediaテキストのCDL化の拡張を推進する.

  • Research Products

    (17 results)

All 2012 2011 Other

All Journal Article (7 results) (of which Peer Reviewed: 7 results) Presentation (8 results) Book (1 results) Remarks (1 results)

  • [Journal Article] Mining Dynamic Social Networks from Public News Articles for Company Value Prediction2012

    • Author(s)
      Y.Jin, C.-Y.Lin, Y.Matsuo, M.Ishizuka
    • Journal Title

      Social Network Analysis and Mining (Springer Wien)

      Volume: 2 Pages: 12

    • DOI

      10.1007/s13278-011-0045-5

    • Peer Reviewed
  • [Journal Article] エンティティペア間類似性を利用した潜在関係検索2011

    • Author(s)
      グェントアンドゥク, ボレガラダヌシカ, 石塚満
    • Journal Title

      情報処理学会論文誌

      Volume: 52 Pages: 1790-1802

    • DOI

      Permalink : http://id.nii.ac.jp/1001/00073937/

    • Peer Reviewed
  • [Journal Article] Automatic Discovery of Personal Name Aliases from the Web2011

    • Author(s)
      D.Bollegala, Y.Matsuo, M.Ishizuka
    • Journal Title

      IEEE Trans.on Knowledge and Data Engineering (TKDE)

      Volume: 23 Pages: 831-844

    • DOI

      10.1109/TKDE.2010.162

    • Peer Reviewed
  • [Journal Article] 関係の対称性および予測語を用いた関係検索の性能向上法2011

    • Author(s)
      後藤友和, グェントアンドゥク, D.ボレガラ, 石塚満
    • Journal Title

      人工知能学会論文誌

      Volume: 26 Pages: 649-656

    • DOI

      10.1527/tisai.26.649

    • Peer Reviewed
  • [Journal Article] A Web Search Engine-based Approach to Measure Semantic Similarity between Words2011

    • Author(s)
      D.Bollegala, Y.Matsuo, M.Ishizuka
    • Journal Title

      IEEE Trans.of Knowledge and Data Engineering (TKDE)

      Volume: 23 Pages: 977-990

    • DOI

      10.1109/TKDE.2010.172

    • Peer Reviewed
  • [Journal Article] 検索エンジンを用いた関連語の自動抽出2011

    • Author(s)
      渡部啓吾, D.Bollegala, 松尾豊, 石塚満
    • Journal Title

      知能と情報(日本知能情報ファジィ学会誌)

      Volume: 23 Pages: 739-748

    • Peer Reviewed
  • [Journal Article] A Supervised Classification Approach for Measuring Relational Similarity between Word Pairs2011

    • Author(s)
      D.Bollegala, Y.Matsuo, M.Ishizuka
    • Journal Title

      IEICE Trans.on Information and Systems

      Volume: E94-D Pages: 2227-2233

    • DOI

      10.1587/transinf.E94.D.2227

    • Peer Reviewed
  • [Presentation] An Inference based Query Engine for RDF Data2012

    • Author(s)
      M.Farouk, M.Ishizuka
    • Organizer
      2012 Int'l Conf.on Information Retrieval & Knowledge Management
    • Place of Presentation
      Kuala Lumpur, Malaysia
    • Year and Date
      2012-03-14
  • [Presentation] Mapping DB to RDF with Additional Discovered Relations2012

    • Author(s)
      M.Farouk, M.Ishizuka
    • Organizer
      11th WSEAS Int'l Conf.on Artificial Intelligence, Knowledge Engineering and Data Bases (AIKED'12)
    • Place of Presentation
      Cambridge, UK
    • Year and Date
      2012-02-24
  • [Presentation] Feature Distance-based Framework for Classification of Low-Frequency Semantic Relations2011

    • Author(s)
      A.K.Horie, M.Ishizuka
    • Organizer
      5th IEEE Int'l Conf.on Semantic Computing
    • Place of Presentation
      Palo Alto, CA, USA
    • Year and Date
      2011-09-19
  • [Presentation] Cross-Language Latent Relational Search : Mapping Knowledge across Languages2011

    • Author(s)
      N.T.Due, D.Bollegala, M.Ishizuka
    • Organizer
      25th AAAI Conf.on Artificial Intelligence (AAAI 2011)
    • Place of Presentation
      San Francisco, USA
    • Year and Date
      2011-08-11
  • [Presentation] Milling Longitudinal Network for Predicting Company Value2011

    • Author(s)
      Y.Jin, C.-Y.Lin, Y.Matsuo, M.Ishizuka
    • Organizer
      22nd Int'l Joint Conf.on Artificial Intelligence (IJCAI-2011)
    • Place of Presentation
      Barcelona, Spain
    • Year and Date
      2011-07-20
  • [Presentation] Exploiting User Interest on Social Media for Aggregating Diverse Data and Predicting Interest2011

    • Author(s)
      N.Nori, D.Bollegala, M.Ishizuka
    • Organizer
      5th Int'l AAAI Conf.on Weblogs and Social Media (ICWSM-2011)
    • Place of Presentation
      Barcelona, Spain
    • Year and Date
      2011-07-19
  • [Presentation] Interest Prediction on Multinominal, Time-Evolving Social Graphs2011

    • Author(s)
      N.Nori, D.Bollegala, M.Ishizuka
    • Organizer
      22nd Int'l Joint Conf.on Artificial Intelligence (IJCAI-2011)
    • Place of Presentation
      Barcelona, Spain
    • Year and Date
      2011-07-19
  • [Presentation] Semantic Structure Content for Dynamic Web Pages2011

    • Author(s)
      M.Farouk, M.Ishizuka
    • Organizer
      2011 Int'l Conf.on Semantic Technology and Information Retrieval (STAIR'11)
    • Place of Presentation
      Putrajaya, Malaysia
    • Year and Date
      2011-06-29
  • [Book] "The Systemic Dimension of Globalization (Piotr Pachura(Ed.))", Chapter 9, Recognition of Real-World Activities from Environmental Sound Cues to Create Life-Log2011

    • Author(s)
      M.A.M.Shaikh, K.Hirose, M.Ishizuka
    • Total Pages
      173-190(288)
    • Publisher
      InTech
  • [Remarks]

    • URL

      http://www.miv.t.u-tokyo.ac.jp/

URL: 

Published: 2013-06-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi