• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実施状況報告書

複合表現を考慮した構文解析手法に関する研究

研究課題

研究課題/領域番号 15K16053
研究機関奈良先端科学技術大学院大学

研究代表者

進藤 裕之  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (20734784)

研究期間 (年度) 2015-04-01 – 2018-03-31
キーワード複単語表現 / 構文解析
研究実績の概要

平成27年度は,複単語表現のコーパス作成と,複単語表現を漏れなく同定する手法の研究を行った.
コーパス作成では,Wiktionaryという知識データベースから網羅的に複単語表現(2語以上の辞書項目)を抽出し,英語のOntoNotesコーパス(新聞記事データ)に対して正例か負例かのアノテーションを行った.複単語表現は様々な種類があり,Wiktionaryで取得できるものは,主に句動詞や機能表現である.一方,Wiktionaryに不足している複単語表現としては,not only ... but also ...のような文全体にまたがるパターンや,複合名詞などであることがわかった.これらの複単語表現に関しては,今後データマイニング手法を援用して大規模なテキストコーパスから半自動的に獲得し,複単語表現の辞書へ取り入れる必要がある.
複単語表現を漏れなく同定する手法に関しては,畳み込みニューラルネットワークを用いて品詞のタグ付けと複単語表現の同定を同時に行う手法を提案し,既存手法やルールベースの手法に対して精度面で優位であることを実証した.従来とは異なり,本手法では文字や単語に関わる特徴量を明示的に定義する必要がなく,ニューラルネットワークによって特徴量を自動的に獲得できるため,実装も容易で精度も高いことがわかった.今後は,本手法と構文解析手法とを組み合わせることによって,最終的に文から複単語表現および構文木を予測するモデルを構築する必要がある.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

当初計画していた二つの項目(コーパス作成と同定手法の考案)について,ほぼ計画通りに研究が進捗している.コーパス作成に関しては,一部の複単語表現に関してアノテーションが完了した.複単語表現の同定手法に関しては,ニューラルネットワークを用いた新たな手法を提案し,既存手法に対する優位性を示すことができた.

今後の研究の推進方策

今度は,前年度に引き続き複単語表現の辞書作成およびコーパスの構築を進めていく.特に,Wiktionaryでは網羅できない種類の複単語表現に関して,どのようなデータベースまたはコーパスから辞書項目を収集するかが大きな課題である.
また,複合語の同定と構文解析を統合して同時に実行できるモデルや手法の開発を推進していく予定である.これは,完全に同時に行う,細かいモデルに分けて最後に統合するなどのいくつかバリエーションが考えられるため,理論的,経験的の両側面から問題に合った方法を考案し評価実験を行っていく予定である.

  • 研究成果

    (6件)

すべて 2016 2015

すべて 学会発表 (6件) (うち国際学会 6件)

  • [学会発表] Construction of an English Dependency Corpus incorporating Compound Function Words2016

    • 著者名/発表者名
      Akihiko Kato, Hiroyuki Shindo, and Yuji Matsumoto
    • 学会等名
      Language Resources and Evaluation Conference
    • 発表場所
      ポルトロス,スロベニア
    • 年月日
      2016-05-23 – 2016-05-28
    • 国際学会
  • [学会発表] An Improved Hierarchical Word Sequence Language Model Using Word Association2015

    • 著者名/発表者名
      Xiaoyi Wu, Yuji Matsumoto, Kevin Duh and Hiroyuki Shindo
    • 学会等名
      International Conference on Statistical Language and Speech Processing
    • 発表場所
      ブタペスト,ハンガリー
    • 年月日
      2015-11-24 – 2015-11-26
    • 国際学会
  • [学会発表] An Efficient Annotation for Phrasal Verbs using Dependency Information2015

    • 著者名/発表者名
      Masayuki Komai, Hiroyuki Shindo and Yuji Matsumoto
    • 学会等名
      Pacific Asia Conference on Language, Information and Computation
    • 発表場所
      上海,中国
    • 年月日
      2015-10-30 – 2015-11-01
    • 国際学会
  • [学会発表] A Latent Variable Model for Joint Pause Prediction and Dependency Parsing2015

    • 著者名/発表者名
      The Tung Nguyen, Graham Neubig, Hiroyuki Shindo, Sakriani Sakti, Tomoki Toda and Satoshi Nakamura
    • 学会等名
      Interspeech
    • 発表場所
      ドレスデン,ドイツ
    • 年月日
      2015-09-06 – 2015-09-10
    • 国際学会
  • [学会発表] Joint Case Argument Identification for Japanese Predicate Argument Structure Analysis2015

    • 著者名/発表者名
      Hiroki Ouchi, Hiroyuki Shindo, Kevin Duh and Yuji Matsumoto
    • 学会等名
      Association for Computational Linguistics
    • 発表場所
      北京,中国
    • 年月日
      2015-07-26 – 2015-07-31
    • 国際学会
  • [学会発表] Semantic Structure Analysis of Noun Phrases using Abstract Meaning Representation2015

    • 著者名/発表者名
      Yuichiro Sawai, Hiroyuki Shindo, and Yuji Matsumoto
    • 学会等名
      Association for Computational Linguistics
    • 発表場所
      北京,中国
    • 年月日
      2015-07-26 – 2015-07-31
    • 国際学会

URL: 

公開日: 2017-01-06  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi