• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Annual Research Report

Improvement of Syntactic Dependency Analysis by Syntax Pattern Acquisition and Coordinate Structure Analysis

Research Project

Project/Area Number 26240035
Research InstitutionNara Institute of Science and Technology

Principal Investigator

松本 裕治  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)

Co-Investigator(Kenkyū-buntansha) 新保 仁  奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90311589)
進藤 裕之  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (20734784)
能地 宏  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (00782541)
Project Period (FY) 2014-04-01 – 2017-03-31
Keywords自然言語処理 / 統語解析 / 並列構造 / 複文構造 / 依存構造解析 / 機械学習 / アノテーション / コーパス
Outline of Annual Research Achievements

自然言語の統語解析の高性能化を目指し、特に英語の複単語表現と複文パターンの収集とコーパスへのアノテーション、および、英語の並列構造解析のためのリソース構築と解析手法の開発に関する研究を行った。
英語の複単語表現については、これまでの機能表現に加えて固有表現や動詞句に関する表現を収集し、Penn Treebankへの半自動アノテーションによるコーパス構築と、複単語表現を考慮した依存構造解析手法に関する研究を行い、複単語表現の出現を考慮することで依存構造解析の高精度化を達成する手法を提案した。また、修飾語を内部に含むような柔軟な構造をもった複単語表現の網羅的な収集を行い、Penn Treebank上の出現を自動的に同定する手法を提案した。
英語の並列構造解析については、昨年度は従来の依存構造解析アルゴリズムを拡張し、並列構造の範囲を動的に考慮しながら依存構造解析を同時に行う手法を提案したが、本年度は、並列構造の範囲同定を行う手法の高性能化について検討し、系列の類似性を測るニューラルネットワークモデルの設計と実装を行った。
上記の研究成果を統合し、複単語表現と並列構造を同時に考慮しながら英文の解析を行うシステムの構築まで達成することができなかったが、引き続き統合的な解析システムとアノテーションを施したデータの構築を行っていく予定である。
なお、本研究で構築した複単語表現アノテーションコーパス(Ontonotes corpusのPenn Treebank対応の部分に複単語表現のアノテーションとそれを考慮した依存構造木)をLinguistic Data Consortiumを通じて公開した。

Research Progress Status

28年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

28年度が最終年度であるため、記入しない。

  • Research Products

    (9 results)

All 2017 2016

All Journal Article (1 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 1 results,  Acknowledgement Compliant: 1 results) Presentation (8 results) (of which Int'l Joint Research: 4 results,  Invited: 1 results)

  • [Journal Article] Transition-Based Dependency Parsing Exploiting Supertags2016

    • Author(s)
      Hiroki Ouchi, Kevin Duh, Hiroyuki Shindo, and Yuji Matsumoto
    • Journal Title

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      Volume: 24 Pages: 2059-2068

    • DOI

      10.1109/TASLP.2016.2598310

    • Peer Reviewed / Int'l Joint Research / Acknowledgement Compliant
  • [Presentation] 依存構造情報を用いた柔軟な複単語表現の同定2017

    • Author(s)
      森元彩華, 吉本暁文, 加藤明彦, 進藤裕之, 松本裕治
    • Organizer
      言語処理学会第23回年次大会
    • Place of Presentation
      茨城県つくば市
    • Year and Date
      2017-03-16
  • [Presentation] 固有表現と複合機能語を考慮したMWEベースの依存構造コーパス構築と解析2017

    • Author(s)
      加藤明彦, 進藤裕之, 松本裕治
    • Organizer
      言語処理学会第23回年次大会
    • Place of Presentation
      茨城県つくば市
    • Year and Date
      2017-03-14
  • [Presentation] 日本語Universal Dependenciesへの複合辞情報付加の試み2017

    • Author(s)
      久保大輝, 田中貴秋, 進藤裕之, 松本裕治, 永田昌明
    • Organizer
      言語処理学会第23回年次大会
    • Place of Presentation
      茨城県つくば市
    • Year and Date
      2017-03-14
  • [Presentation] 複単語表現を考慮した英語の依存構造解析モデリング2016

    • Author(s)
      加藤明彦・進藤裕之・松本裕治
    • Organizer
      情報処理学会 第229回自然言語処理研究会
    • Place of Presentation
      東京都武蔵野市
    • Year and Date
      2016-12-22
  • [Presentation] Identification of Flexible Multiword Expressions with the Help of Dependency Structure Annotation2016

    • Author(s)
      Ayaka Morimoto, Akifumi Yoshimoto, Akihiko Kato, Hiroyuki Shindo, and Yuji Matsumoto
    • Organizer
      the Workshop on Grammar and Lexicon: interactions and interfaces
    • Place of Presentation
      Osaka, Japan
    • Year and Date
      2016-12-11
    • Int'l Joint Research
  • [Presentation] A Generalized Framework for Hierarchical Word Sequence Language Model2016

    • Author(s)
      Xiaoyi Wu, Kevin Duh, and Yuji Matsumoto
    • Organizer
      The 30th Pacific Asia Conference on Language, Information and Computation
    • Place of Presentation
      Seoul, Korea
    • Year and Date
      2016-10-29
    • Int'l Joint Research
  • [Presentation] Parsing Complex Linguistic Constructions2016

    • Author(s)
      Yuji Matsumoto
    • Organizer
      The Eighth International Conference on Knowledge and Systems Engineering
    • Place of Presentation
      Hanoi, Vietnam
    • Year and Date
      2016-10-07
    • Int'l Joint Research / Invited
  • [Presentation] Construction of an English Dependency Corpus incorporating Compound Function Words2016

    • Author(s)
      Akihiko Kato, Hiroyuki Shindo, and Yuji Matsumoto
    • Organizer
      the Tenth International Conference on Language Resources and Evaluation
    • Place of Presentation
      Portoroz, Slovenia
    • Year and Date
      2016-05-26
    • Int'l Joint Research

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi