• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Annual Research Report

外れ値検出手法を利用したコーパスからの新語義発見

Research Project

Project/Area Number 23500167
Research InstitutionIbaraki University

Principal Investigator

新納 浩幸  茨城大学, 工学部, 准教授 (10250987)

Keywords外れ値 / 新語義 / BCCWJ / LOF / 生成モデル
Research Abstract

本研究では、対象単語の語義が既存の語義とは異なる意味(新語義)で使われている用例をコーパスから自動発見するタスクに取り組んだ。データマイニング分野の外れ値検出の手法を利用すること、教師データを使うことが特徴である。研究期間内(3年間)で、(1) 語義識別問題の従来手法を新語義発見に用いる際の問題点を明らかにする、(2) LOF におけるタグ付き用例の利用方法を提案する、(3) One Class SVM におけるタグ付き用例の利用方法を提案する、(4)確率モデル、LOF、One Class SVM の検出結果を総合して最終的な検出結果を求める、の4点を行う計画をたてた。各項目は計画通りに実施でき、最終的には対象単語の用例の生成確率が極端に低いものを外れ値とするという手法と教師付き LOF とを組み合わせて利用した新語義検出手法を提案した。これは言語処理学会の論文誌に採択された。
また最終年度には、本研究から得られた外れ値度合いの算出法が、語義曖昧性解消の領域適応の問題に応用できることを示した。これは語義曖昧性解消の領域適応ではソース領域の用例がターゲット領域においてどの程度重要かを算出することが鍵であり、その重要度を外れ値度合いから推定するものである。この語義曖昧性解消の領域適応に関する研究も、論文誌に採択された。
外れ値検出は大きな自然言語処理の多くのタスクにおいて、様々な応用が可能であり、重要な技術である。今後は本研究で得られた知見を他の自然言語処理のタスクに活用する。

  • Research Products

    (11 results)

All 2014 2013

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (9 results)

  • [Journal Article] 共変量シフトの問題としての語義曖昧性解消の領域適応2014

    • Author(s)
      新納浩幸,佐々木稔
    • Journal Title

      自然言語処理

      Volume: 21 Pages: 61-79

    • Peer Reviewed
  • [Journal Article] k近傍法とトピックモデルを利用した語義曖昧性解消の領域適応2013

    • Author(s)
      新納浩幸,佐々木稔
    • Journal Title

      自然言語処理

      Volume: 20 Pages: 707-726

    • Peer Reviewed
  • [Presentation] 領域間距離を利用した能動学習による語義曖昧性解消の領域適応2014

    • Author(s)
      小野寺善行,新納浩幸
    • Organizer
      第5回日本語学ワークショップ
    • Place of Presentation
      国立国語研究所
    • Year and Date
      20140306-20140307
  • [Presentation] uLSIF による重み付き学習を利用した語義曖昧性解消の領域適応2014

    • Author(s)
      菊池裕紀,新納浩幸
    • Organizer
      第5回日本語学ワークショップ
    • Place of Presentation
      国立国語研究所
    • Year and Date
      20140306-20140307
  • [Presentation] 語義曖昧性解消を対象とした領域固有のシソーラスの構築2014

    • Author(s)
      新納浩幸, 國井慎也, 佐々木稔
    • Organizer
      第5回日本語学ワークショップ
    • Place of Presentation
      国立国語研究所
    • Year and Date
      20140306-20140307
  • [Presentation] Combined Use of Topic Models on Unsupervised Domain Adaptation for Word Sense Disambiguation2013

    • Author(s)
      Shinya Kunii and Hiroyuki Shinnou
    • Organizer
      PACLIC-27
    • Place of Presentation
      台湾、台北
    • Year and Date
      20131121-20131124
  • [Presentation] クラスタリングを利用した能動学習による語義曖昧性解消の領域適応2013

    • Author(s)
      小野寺善行,新納浩幸
    • Organizer
      第4回日本語学ワークショップ
    • Place of Presentation
      国立国語研究所
    • Year and Date
      20130904-20130905
  • [Presentation] 語義曖昧性解消の領域適応における Misleading データの存在と検出2013

    • Author(s)
      吉田拓夢,新納浩幸
    • Organizer
      第4回日本語学ワークショップ
    • Place of Presentation
      国立国語研究所
    • Year and Date
      20130904-20130905
  • [Presentation] Combined Use of Topic Models on Unsupervised Domain Adaptation for Word Sense Disambiguation2013

    • Author(s)
      Shinya Kunii and Hiroyuki Shinnou
    • Organizer
      情報処理学会自然言語処理研究会
    • Place of Presentation
      はこだて未来大学
    • Year and Date
      20130718-20130719
  • [Presentation] Domain Adaptation for Word Sense Disambiguation under the Problem of Covariate Shift2013

    • Author(s)
      Horonori Kikuchi and Hiroyuki Shinnou
    • Organizer
      情報処理学会自然言語処理研究会
    • Place of Presentation
      はこだて未来大学
    • Year and Date
      20130718-20130719
  • [Presentation] k近傍法とトピックモデルを利用した語義曖昧性解消の領域適応2013

    • Author(s)
      新納浩幸, 佐々木稔
    • Organizer
      情報処理学会自然言語処理研究会
    • Place of Presentation
      JAIST 東京サテライト
    • Year and Date
      20130523-20130524

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi