• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実績報告書

外れ値検出手法を利用したコーパスからの新語義発見

研究課題

研究課題/領域番号 23500167
研究機関茨城大学

研究代表者

新納 浩幸  茨城大学, 工学部, 准教授 (10250987)

キーワード外れ値 / 新語義 / BCCWJ / LOF / 生成モデル
研究概要

本研究では、対象単語の語義が既存の語義とは異なる意味(新語義)で使われている用例をコーパスから自動発見するタスクに取り組んだ。データマイニング分野の外れ値検出の手法を利用すること、教師データを使うことが特徴である。研究期間内(3年間)で、(1) 語義識別問題の従来手法を新語義発見に用いる際の問題点を明らかにする、(2) LOF におけるタグ付き用例の利用方法を提案する、(3) One Class SVM におけるタグ付き用例の利用方法を提案する、(4)確率モデル、LOF、One Class SVM の検出結果を総合して最終的な検出結果を求める、の4点を行う計画をたてた。各項目は計画通りに実施でき、最終的には対象単語の用例の生成確率が極端に低いものを外れ値とするという手法と教師付き LOF とを組み合わせて利用した新語義検出手法を提案した。これは言語処理学会の論文誌に採択された。
また最終年度には、本研究から得られた外れ値度合いの算出法が、語義曖昧性解消の領域適応の問題に応用できることを示した。これは語義曖昧性解消の領域適応ではソース領域の用例がターゲット領域においてどの程度重要かを算出することが鍵であり、その重要度を外れ値度合いから推定するものである。この語義曖昧性解消の領域適応に関する研究も、論文誌に採択された。
外れ値検出は大きな自然言語処理の多くのタスクにおいて、様々な応用が可能であり、重要な技術である。今後は本研究で得られた知見を他の自然言語処理のタスクに活用する。

  • 研究成果

    (11件)

すべて 2014 2013

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (9件)

  • [雑誌論文] 共変量シフトの問題としての語義曖昧性解消の領域適応2014

    • 著者名/発表者名
      新納浩幸,佐々木稔
    • 雑誌名

      自然言語処理

      巻: 21 ページ: 61-79

    • 査読あり
  • [雑誌論文] k近傍法とトピックモデルを利用した語義曖昧性解消の領域適応2013

    • 著者名/発表者名
      新納浩幸,佐々木稔
    • 雑誌名

      自然言語処理

      巻: 20 ページ: 707-726

    • 査読あり
  • [学会発表] 領域間距離を利用した能動学習による語義曖昧性解消の領域適応2014

    • 著者名/発表者名
      小野寺善行,新納浩幸
    • 学会等名
      第5回日本語学ワークショップ
    • 発表場所
      国立国語研究所
    • 年月日
      20140306-20140307
  • [学会発表] uLSIF による重み付き学習を利用した語義曖昧性解消の領域適応2014

    • 著者名/発表者名
      菊池裕紀,新納浩幸
    • 学会等名
      第5回日本語学ワークショップ
    • 発表場所
      国立国語研究所
    • 年月日
      20140306-20140307
  • [学会発表] 語義曖昧性解消を対象とした領域固有のシソーラスの構築2014

    • 著者名/発表者名
      新納浩幸, 國井慎也, 佐々木稔
    • 学会等名
      第5回日本語学ワークショップ
    • 発表場所
      国立国語研究所
    • 年月日
      20140306-20140307
  • [学会発表] Combined Use of Topic Models on Unsupervised Domain Adaptation for Word Sense Disambiguation2013

    • 著者名/発表者名
      Shinya Kunii and Hiroyuki Shinnou
    • 学会等名
      PACLIC-27
    • 発表場所
      台湾、台北
    • 年月日
      20131121-20131124
  • [学会発表] クラスタリングを利用した能動学習による語義曖昧性解消の領域適応2013

    • 著者名/発表者名
      小野寺善行,新納浩幸
    • 学会等名
      第4回日本語学ワークショップ
    • 発表場所
      国立国語研究所
    • 年月日
      20130904-20130905
  • [学会発表] 語義曖昧性解消の領域適応における Misleading データの存在と検出2013

    • 著者名/発表者名
      吉田拓夢,新納浩幸
    • 学会等名
      第4回日本語学ワークショップ
    • 発表場所
      国立国語研究所
    • 年月日
      20130904-20130905
  • [学会発表] Combined Use of Topic Models on Unsupervised Domain Adaptation for Word Sense Disambiguation2013

    • 著者名/発表者名
      Shinya Kunii and Hiroyuki Shinnou
    • 学会等名
      情報処理学会自然言語処理研究会
    • 発表場所
      はこだて未来大学
    • 年月日
      20130718-20130719
  • [学会発表] Domain Adaptation for Word Sense Disambiguation under the Problem of Covariate Shift2013

    • 著者名/発表者名
      Horonori Kikuchi and Hiroyuki Shinnou
    • 学会等名
      情報処理学会自然言語処理研究会
    • 発表場所
      はこだて未来大学
    • 年月日
      20130718-20130719
  • [学会発表] k近傍法とトピックモデルを利用した語義曖昧性解消の領域適応2013

    • 著者名/発表者名
      新納浩幸, 佐々木稔
    • 学会等名
      情報処理学会自然言語処理研究会
    • 発表場所
      JAIST 東京サテライト
    • 年月日
      20130523-20130524

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi