• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2010 Fiscal Year Annual Research Report

構造的言語処理による情報検索基盤技術の構築

Planned Research

Project AreaCyber Infrastructure for the Information-explosion Era
Project/Area Number 19024040
Research InstitutionKyoto University

Principal Investigator

黒橋 禎夫  京都大学, 情報学研究科, 教授 (50263108)

Co-Investigator(Kenkyū-buntansha) 柴田 知秀  京都大学, 情報学研究科, 助教 (70452315)
河原 大輔  京都大学, 情報学研究科, 准教授 (10450694)
Keywords自然言語処理 / 情報検索 / 述語項構造 / 同義関係 / 意味サーチ
Research Abstract

(1)述語項構造による深い文理解の実現と検索の高度化
検索の高度化を実現するためには,テキスト中の述語とその項の関係をはじめとした語と語の関係を正しく認識することが必要となる.16億文コーパスから自動獲得した述語と項の関係に関する知識(格フレーム)を基に,省略された項および格助詞の補完,使役・受身形から原形への変換を実現し,述語項構造レベルでの正確なマッチングに基づく検索を実現した.この中で,省略解析について全体精度はF値0.40程度であるが,検索において重要となる動作主の省略についてはF値0.55,これを同一文内の出現に限定する場合にはF値0.70を達成した.
(2)ウェブからの未知語自動獲得と形態素解析の強化
ウェブテキスト処理においては未知語に起因する解析誤りが問題となる.この問題を解決するために,表記ゆれ知識を利用した未知語検出により,過分割されたひらがな未知語の検出率を34.5%から72.0%に大幅に向上させた.また,未知語同定について,従来研究が頻度10未満の候補を獲得対象から外していたのに対して、比較的少数(4~7例)の出現から高精度(97.3-98.5%)の未知語獲得を実現した.さらに,未知語獲得にともなう辞書拡張により形態素解析の精度が向上することを示した.
(3)意味的一致をとらえる検索エンジン基盤TSUBAKIの整備・展開
TSUBAKIについて,同義関係,上位下位関係,述語項構造関係などのインデクシングを強化し,内容の意味的一致をより柔軟・正確にとらえることを可能とした.また,TSUBAKIの展開として,京都大学附属病院の診断画像所見検索,英文構文解析器Enjuとの統合によるMEDLINE検索などへの適用を進めた.

  • Research Products

    (9 results)

All 2010

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (8 results)

  • [Journal Article] The Effect of Corpus Size on Case Frame Acquisition for Predicate-Argument Structure Analysis2010

    • Author(s)
      Ryohei Sasano, Daisuke Kawahara, Sadao Kurohashi
    • Journal Title

      IEICE TRANSACTIONS on Information and Systems

      Volume: Vol.E93-D Pages: 1361-1368

    • Peer Reviewed
  • [Presentation] Exploiting Term Importance Categories and Dependency Relations for Natural Language Search2010

    • Author(s)
      Keiji Shinzato, Sadao Kurohashi
    • Organizer
      The Second Workshop on NLPIX
    • Place of Presentation
      Beijing, China
    • Year and Date
      2010-08-28
  • [Presentation] Summarizing Search Results using PLSI2010

    • Author(s)
      Jun Harashima, Sadao Kurohashi
    • Organizer
      The Second Workshop on NLPIX 2010
    • Place of Presentation
      Beijing, China
    • Year and Date
      2010-08-28
  • [Presentation] Identifying Contradictory and Contrastive Relations between Statements to Outline Web Information on a Given Topic2010

    • Author(s)
      Daisuke Kawahara, Kentaro Inui, Sadao Kurohashi
    • Organizer
      The 23rd International Conference on Computational Linguistics
    • Place of Presentation
      Beijing, China
    • Year and Date
      2010-08-27
  • [Presentation] Semantic Classification of Automatically Acquired Nouns using Lexico-Syntactic Clues2010

    • Author(s)
      Yugo Murawaki, Sadao Kurohashi
    • Organizer
      23rd International Conference on Computational Linguistics
    • Place of Presentation
      Beijing, China
    • Year and Date
      2010-08-26
  • [Presentation] Using Smaller Constituents Rather Than Sentences in Active Learning for Japanese Dependency Parsing2010

    • Author(s)
      Manabu Sassano, Sadao Kurohashi
    • Organizer
      The 48th Annual Meeting of the Association for Computational Linguistics
    • Place of Presentation
      Uppsala, Sweden
    • Year and Date
      2010-07-12
  • [Presentation] Dependency Tree-based Sentiment Classification using CRFs with Hidden Variables2010

    • Author(s)
      Tetsuji Nakagawa, Kentaro Inui, Sadao Kurohashi
    • Organizer
      Human Language Technologies : The 11th Annual Conference of the North American Chapter of the Association for Computational Linguistics
    • Place of Presentation
      Los Angeles, U.S.A.
    • Year and Date
      2010-06-04
  • [Presentation] Acquiring Reliable Predicate-argument Structures from Raw Corpora for Case Frame Compilation2010

    • Author(s)
      Daisuke Kawahara, Sadao Kurohashi
    • Organizer
      7th International Conference on Language Resources and Evaluation
    • Place of Presentation
      Malta
    • Year and Date
      2010-05-20
  • [Presentation] Online Japanese Unknown Morpheme Detection using Orthographic Variation2010

    • Author(s)
      Yugo Murawaki, Sadao Kurohashi
    • Organizer
      The 7th International Conference on Language Resources and Evaluation
    • Place of Presentation
      Malta
    • Year and Date
      2010-05-19

URL: 

Published: 2012-07-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi