• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2017 Fiscal Year Annual Research Report

Research on syntactic parsing with multiword expressions

Research Project

Project/Area Number 15K16053
Research InstitutionNara Institute of Science and Technology

Principal Investigator

進藤 裕之  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (20734784)

Project Period (FY) 2015-04-01 – 2018-03-31
Keywords複単語表現 / 構文解析 / アノテーション
Outline of Annual Research Achievements

平成29年度は,複単語表現のコーパス構築と,複単語表現の解析手法の拡張に取り組んだ.
まず,コーパス構築に関しては,動詞となる複単語表現("take~off"など)の辞書収集とコーパスアノテーションを行った.動詞となる複単語表現は,非連続なパターンとなることが多いため,単語の品詞と依存構造を利用して半自動的にアノテーションを行うことに成功した.その結果,本研究の成果は,従来研究と比較して,機械学習の訓練データとして用いることができる大規模な複単語表現コーパスとなっている.また,構築した動詞複単語コーパスは,Web上で公開しており,誰でも無償で利用することができる.
次に,複単語表現の解析手法に関しては,従来のように複単語表現のみを解析するのではなく,構文解析と複単語表現を同時に解析する手法を考案し,その性能を評価した.具体的には,依存構造,複単語表現,固有表現の情報を1つの木構造として整合性が取れるように,それぞれの文のアノテーションを統合を行った.そして,この木構造のアノテーションデータを機械学習の訓練データとして用いて,文から木構造を予測する構文解析器のモデルを構築した.
評価実験の結果,複単語表現のみを単独で解析するよりも,同時に解析することにより,複単語表現,依存構造,固有表現の解析性能がそれぞれ向上することを実証した.
これまでに,頻度の高い複単語表現,特に動詞と名詞の複単語表現に関しては,大規模なコーパス構築および解析手法の提案・評価が完了した.この一連の手法を他の品詞にも適用してコーパスの網羅性を高めることは可能であり,今後の課題とする.

  • Research Products

    (8 results)

All 2018 2017

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (7 results) (of which Int'l Joint Research: 7 results)

  • [Journal Article] Learning Distributed Representations of Texts and Entities from Knowledge Base2017

    • Author(s)
      Ikuya Yamada, Hiroyuki Shindo, Hideaki Takeda, Yoshiyasu Takefuji
    • Journal Title

      Transactions of the Association for Computational Linguistics

      Volume: 5 Pages: 397-411

    • Peer Reviewed / Open Access
  • [Presentation] Representation Learning of Entities and Documents from Knowledge Base Descriptions2018

    • Author(s)
      Ikuya Yamada, Hiroyuki Shindo
    • Organizer
      International Conference on Computational Linguistics
    • Int'l Joint Research
  • [Presentation] PDFAnno: a Web-based Linguistic Annotation Tool for PDF Documents2018

    • Author(s)
      Hiroyuki Shindo, Yuji Matsumoto
    • Organizer
      Language Resources and Evaluation Conference
    • Int'l Joint Research
  • [Presentation] Construction of Large-scale English Verbal Multiword Expression Annotated Corpus2018

    • Author(s)
      Akihiko Kato, Hiroyuki Shindo, Yuji Matsumoto
    • Organizer
      Language Resources and Evaluation Conference
    • Int'l Joint Research
  • [Presentation] Coordination Boundary Identification with Similarity and Replaceability2017

    • Author(s)
      Hiroki Teranishi, Hiroyuki Shindo, Yuji Matsumoto
    • Organizer
      International Joint Conference on Natural Language Processing
    • Int'l Joint Research
  • [Presentation] Segment-Level Neural Conditional Random Fields for Named Entity Recognition2017

    • Author(s)
      Motoki Sato, Hiroyuki Shindo, Yuji Matsumoto
    • Organizer
      International Joint Conference on Natural Language Processing
    • Int'l Joint Research
  • [Presentation] Joint Prediction of Morphosyntactic Categories for Fine-Grained Arabic Part-of-Speech Tagging Exploiting Tag Dictionary Information2017

    • Author(s)
      Go Inoue, Hiroyuki Shindo, Yuji Matsumoto
    • Organizer
      The SIGNLL Conference on Computational Natural Language Learning
    • Int'l Joint Research
  • [Presentation] English Multiword Expression-aware Dependency Parsing including Named Entities2017

    • Author(s)
      Akihiko Kato, Hiroyuki Shindo, Yuji Matsumoto
    • Organizer
      Annual Meeting of the Association for Compurational Linguistics
    • Int'l Joint Research

URL: 

Published: 2018-12-17  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi