• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Annual Research Report

単語の語義別コロケーション抽出とその語義識別、新語義発見への適用に関する研究

Research Project

Project/Area Number 24700131
Research InstitutionIbaraki University

Principal Investigator

佐々木 稔  茨城大学, 工学部, 講師 (60344834)

Keywords語義別コロケーション / 用例文抽出 / 語義識別 / ベクトル空間モデル / 国際情報交換 / イスタンブール / バルセロナ / シドニー
Research Abstract

平成24年度は、「訓練データからの語義別コロケーション抽出と、それを考慮した語義識別モデル構築法の検討」についての研究を行った。語義別コロケーション抽出では、新語義も含めたあまり出現しない語義の用例抽出を行うが必要ある。そのため、用例文集合から対象単語が特異な使用をしている用例を検索する手法の開発を行った。この手法は、国際会議 LREC2012 において発表し、低頻度語義を持つ用例の特徴を分析し、それを含む用例を効率的に抽出することを実証した。
また、訓練データからの語義別コロケーションを抽出するためには、正解語義が割り振られた用例文集合に対し、用例文間の類似性を測定することが重要な課題となる。そのため、用例間類似度を語義ラベルに応じて学習する手法の開発を行った。実験データについては、これまでの研究で利用した「Semeval2010日本語語義曖昧性タスク」で使われたコーパスを利用することで、多種多様な単語について実験を行うことができた。この手法は、国際会議 SEMAPRO2012 において発表し、開発した用例間類似度を利用することで、従来の類似度尺度よりも高い語義識別精度が得られたことを実証した。
平成25年度は、語義別コロケーションを考慮した共起ベクトルの構築手法の検討」について研究を行った。語義毎に抽出したコロケーション情報を、他の特徴と組み合わせてベクトル表現をするのが難しい。そのため、コロケーションなどの複数語の共起を既存手法で得られる単語共起ベクトルの空間に組み込む手法の開発を行った。「Semeval2010日本語語義曖昧性タスク」で語義識別実験を行った結果、この手法を利用して複数語からなるコロケーション情報が語義識別に対して効果的であることを実証した。この手法は国際会議 NLP-2014 において発表し、この手法の妥当性と課題について議論を行った。

  • Research Products

    (5 results)

All 2014 2013

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (3 results)

  • [Journal Article] 共変量シフトの問題としての語義曖昧性解消の領域適応2014

    • Author(s)
      新納浩幸、佐々木稔
    • Journal Title

      自然言語処理

      Volume: 21巻 Pages: 61-79

    • Peer Reviewed
  • [Journal Article] k近傍法とトピックモデルを利用した語義曖昧性解消の領域適応2013

    • Author(s)
      新納浩幸、佐々木稔
    • Journal Title

      自然言語処理

      Volume: 20 Pages: 707, 726

    • Peer Reviewed
  • [Presentation] インスタンス選択による文書データの効率的な分類モデル構築手法2014

    • Author(s)
      小幡智裕, 佐々木稔
    • Organizer
      言語処理学会第20回年次大会
    • Place of Presentation
      北海道大学
    • Year and Date
      20140317-20140321
  • [Presentation] 語義曖昧性解消を対象とした領域固有のシソーラスの構築2014

    • Author(s)
      新納 浩幸,國井 慎也,佐々木 稔
    • Organizer
      第5回コーパス日本語学ワークショップ
    • Place of Presentation
      国立国語研究所
    • Year and Date
      20140307-20140307
  • [Presentation] Latent Semantic Word Sense Disambiguation Using Global Co-occurrence Information2014

    • Author(s)
      Minoru Sasaki
    • Organizer
      Third International Conference on Natural Language Processing
    • Place of Presentation
      シドニー
    • Year and Date
      20140221-20140222

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi