• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Annual Research Report

構文パターン獲得と並列構造解析による統語的依存構造解析の高精度化

Research Project

Project/Area Number 26240035
Research InstitutionNara Institute of Science and Technology

Principal Investigator

松本 裕治  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)

Co-Investigator(Kenkyū-buntansha) 新保 仁  奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90311589)
Duh Kevin  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80637322)
進藤 裕之  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (20734784)
Project Period (FY) 2014-04-01 – 2017-03-31
Keywords自然言語処理 / 並列構造解析 / 依存構造解析 / 多言語処理 / 機械学習 / 構文パターン
Outline of Annual Research Achievements

並列構造解析を考慮した依存構造解析アルゴリズムを実装し,英語の代表的な統語解析アノテーション付コーパスであるPenn Treebankから自動変換によって得られた依存構造木におけるカバレージの評価を行った.また,部分並列構造を含む文の解析に対応するため,Penn Treebankにおける並列構造の範囲および並列構造に関連する依存構造のアノテーションの仕様設計を開始した.
英語の構造パターン収集のために作成した例文集に対して,複単語表現および複文構文パターンのアノテーション作業を昨年度より継続し,収集した700文に対するアノテーションを完了した.複単語表現および複文構文パターンを辞書管理システムに格納するためのフォーマットの詳細設計を行った.
機能表現として働く複単語表現および句動詞の網羅的な辞書構築を行い,Penn Treebankにおけるすべての出現について,正用例かどうかの確認を半自動で行う方法を実行し,複単語機能表現および句動詞のアノテーションがほどこされたコーパスを構築した.
大規模なコーパスから階層的な言語表現パターンを抽出する方法について検討し,2種類の手法を実装し,言語モデルとしての性能評価実験を行った.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究の目標である並列構造解析および複文パターンの構築について基礎的な実験および基盤となる辞書の構築とコーパスへのアノテーション作業に一定の区切りをつけることができた.

Strategy for Future Research Activity

Penn Treebank中の並列構造と依存構造のアノテーションの詳細設計を行い,句構造情報を利用した自動アノテーションと人手による修正作業をコーパス全体に対して行う.このコーパスを用いて並列構造の範囲同定および依存構造解析の実験を行い,性能を評価する.特に,並列構造解析と依存構造解析を同時に行う手法について再検討を行い,部分並列構造の解析にも対応させるとともに,その性能評価を行う.
本年度収集した英語の複文構文パターンを辞書として完成させて辞書管理システムに収納するフォーマットを決定し,辞書データとして完結させる.さらに,収集した複文パターンのPenn Treebankにおける出現を網羅的に探索し,一部人手による確認を行いながら半自動でアノテーションを行う方法を検討し,複文構文パターンを網羅的にアノテーションされたコーパスを構築する.
複単語表現および複文構文パターンを利用して依存構造解析の性能を向上させるアルゴリズムの詳細設計と実装を行い,アルゴリズムの性能評価実験を行う.
句動詞以外に,修飾語等を伴うことのできる柔軟な複単語表現の収集を行う.
本研究課題で構築した複単語表現,句動詞,複文構文パターンの辞書,および,並列構造,複単語表現,複文構文パターンのアノテーションを行ったコーパスの情報を研究利用可能な言語資源として無償公開する.

  • Research Products

    (7 results)

All 2015

All Presentation (7 results) (of which Int'l Joint Research: 5 results)

  • [Presentation] An Improved Hierarchical Word Sequence Language Model Using Word Association2015

    • Author(s)
      Xiaoyi Wu, Yuji Matsumoto, Kevin Duh, Hiroyuki Shindo
    • Organizer
      Statistical Language and Speech Processing
    • Place of Presentation
      Budapest, Hungary
    • Year and Date
      2015-11-24 – 2015-11-26
    • Int'l Joint Research
  • [Presentation] An Efficient Annotation for Phrasal Verbs using Dependency Information2015

    • Author(s)
      Masayuki Komai, Hiroyuki Shindo, Yuji Matsumoto
    • Organizer
      The 29th Pacific Asia Conference on Language, Information and Computation
    • Place of Presentation
      Shanghai, China
    • Year and Date
      2015-10-30 – 2015-11-01
    • Int'l Joint Research
  • [Presentation] An Improved Hierarchical Word Sequence Language Model Using Directional Information2015

    • Author(s)
      Xiaoyi Wu, Yuji Matsumoto
    • Organizer
      The 29th Pacific Asia Conference on Language, Information and Computation
    • Place of Presentation
      Shanghai, China
    • Year and Date
      2015-10-30 – 2015-11-01
    • Int'l Joint Research
  • [Presentation] 複合機能語を考慮した英語の依存構造コーパスの構築2015

    • Author(s)
      加藤明彦,進藤裕之,松本裕治
    • Organizer
      情報処理学会 第223回自然言語処理研究会 Vol.2015-NL-223
    • Place of Presentation
      広島経済大学(広島県広島市)
    • Year and Date
      2015-09-27 – 2015-09-28
  • [Presentation] Coordination-aware dependency parsing2015

    • Author(s)
      Akifumi Yoshimoto, Kazuo Hara, Masashi Shimbo, Yuji Matsumoto
    • Organizer
      The 14th International Conference on Parsing Technologies
    • Place of Presentation
      Bilbao, the Basque Country
    • Year and Date
      2015-07-22 – 2015-07-24
    • Int'l Joint Research
  • [Presentation] CKY Parsing with Independence Constraints2015

    • Author(s)
      Joseph Irwin, Yuji Matsumoto
    • Organizer
      The 14th International Conference on Parsing Technologies
    • Place of Presentation
      Bilbao, the Basque Country
    • Year and Date
      2015-07-22 – 2015-07-24
    • Int'l Joint Research
  • [Presentation] 並列構造解析に向けた依存構造解析アルゴリズムの拡張2015

    • Author(s)
      吉本暁文, 新保仁, 原一夫, 松本裕治
    • Organizer
      情報処理学会 第221回自然言語処理研究会 第106回音声言語情報処理研究会 共催研究会 Vol.2015-NL-221
    • Place of Presentation
      東北大学(宮城県仙台市)
    • Year and Date
      2015-05-25 – 2015-05-26

URL: 

Published: 2017-01-06  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi