• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実績報告書

複合表現を考慮した構文解析手法に関する研究

研究課題

研究課題/領域番号 15K16053
研究機関奈良先端科学技術大学院大学

研究代表者

進藤 裕之  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (20734784)

研究期間 (年度) 2015-04-01 – 2018-03-31
キーワード複単語表現 / 構文解析 / アノテーション
研究実績の概要

平成29年度は,複単語表現のコーパス構築と,複単語表現の解析手法の拡張に取り組んだ.
まず,コーパス構築に関しては,動詞となる複単語表現("take~off"など)の辞書収集とコーパスアノテーションを行った.動詞となる複単語表現は,非連続なパターンとなることが多いため,単語の品詞と依存構造を利用して半自動的にアノテーションを行うことに成功した.その結果,本研究の成果は,従来研究と比較して,機械学習の訓練データとして用いることができる大規模な複単語表現コーパスとなっている.また,構築した動詞複単語コーパスは,Web上で公開しており,誰でも無償で利用することができる.
次に,複単語表現の解析手法に関しては,従来のように複単語表現のみを解析するのではなく,構文解析と複単語表現を同時に解析する手法を考案し,その性能を評価した.具体的には,依存構造,複単語表現,固有表現の情報を1つの木構造として整合性が取れるように,それぞれの文のアノテーションを統合を行った.そして,この木構造のアノテーションデータを機械学習の訓練データとして用いて,文から木構造を予測する構文解析器のモデルを構築した.
評価実験の結果,複単語表現のみを単独で解析するよりも,同時に解析することにより,複単語表現,依存構造,固有表現の解析性能がそれぞれ向上することを実証した.
これまでに,頻度の高い複単語表現,特に動詞と名詞の複単語表現に関しては,大規模なコーパス構築および解析手法の提案・評価が完了した.この一連の手法を他の品詞にも適用してコーパスの網羅性を高めることは可能であり,今後の課題とする.

  • 研究成果

    (8件)

すべて 2018 2017

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (7件) (うち国際学会 7件)

  • [雑誌論文] Learning Distributed Representations of Texts and Entities from Knowledge Base2017

    • 著者名/発表者名
      Ikuya Yamada, Hiroyuki Shindo, Hideaki Takeda, Yoshiyasu Takefuji
    • 雑誌名

      Transactions of the Association for Computational Linguistics

      巻: 5 ページ: 397-411

    • 査読あり / オープンアクセス
  • [学会発表] Representation Learning of Entities and Documents from Knowledge Base Descriptions2018

    • 著者名/発表者名
      Ikuya Yamada, Hiroyuki Shindo
    • 学会等名
      International Conference on Computational Linguistics
    • 国際学会
  • [学会発表] PDFAnno: a Web-based Linguistic Annotation Tool for PDF Documents2018

    • 著者名/発表者名
      Hiroyuki Shindo, Yuji Matsumoto
    • 学会等名
      Language Resources and Evaluation Conference
    • 国際学会
  • [学会発表] Construction of Large-scale English Verbal Multiword Expression Annotated Corpus2018

    • 著者名/発表者名
      Akihiko Kato, Hiroyuki Shindo, Yuji Matsumoto
    • 学会等名
      Language Resources and Evaluation Conference
    • 国際学会
  • [学会発表] Coordination Boundary Identification with Similarity and Replaceability2017

    • 著者名/発表者名
      Hiroki Teranishi, Hiroyuki Shindo, Yuji Matsumoto
    • 学会等名
      International Joint Conference on Natural Language Processing
    • 国際学会
  • [学会発表] Segment-Level Neural Conditional Random Fields for Named Entity Recognition2017

    • 著者名/発表者名
      Motoki Sato, Hiroyuki Shindo, Yuji Matsumoto
    • 学会等名
      International Joint Conference on Natural Language Processing
    • 国際学会
  • [学会発表] Joint Prediction of Morphosyntactic Categories for Fine-Grained Arabic Part-of-Speech Tagging Exploiting Tag Dictionary Information2017

    • 著者名/発表者名
      Go Inoue, Hiroyuki Shindo, Yuji Matsumoto
    • 学会等名
      The SIGNLL Conference on Computational Natural Language Learning
    • 国際学会
  • [学会発表] English Multiword Expression-aware Dependency Parsing including Named Entities2017

    • 著者名/発表者名
      Akihiko Kato, Hiroyuki Shindo, Yuji Matsumoto
    • 学会等名
      Annual Meeting of the Association for Compurational Linguistics
    • 国際学会

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi