• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Research-status Report

外れ値検出手法からの重み設定による共変量シフト下における語義曖昧性解消の領域適応

Research Project

Project/Area Number 26330244
Research InstitutionIbaraki University

Principal Investigator

新納 浩幸  茨城大学, 工学部, 教授 (10250987)

Project Period (FY) 2014-04-01 – 2017-03-31
Keywords語義曖昧性解消 / 領域適応 / 共変量シフト / 確率密度比 / 重み付き学習 / 外れ値検出
Outline of Annual Research Achievements

自然言語処理の各種タスクにおいて教師あり学習手法が利用されるが,多くの場合,領域適応の問題が生じてしまう.一方,機械学習の分野では共変量シフト下の学習が近年大きく進展した.共変量シフト下の学習は領域適応に対して利用可能であるが,自然言語処理の分野ではほとんど用いられていない.本研究では語義曖昧性解消の領域適応の問題に対して,共変量シフト下の学習を利用する.その際には確率密度比の算出と重み付き学習法がポイントであるが,それら実現法を具体的に提案する.また共変量シフト下の学習を語義曖昧性解消の領域適応の問題に適用する際に生じる問題点を指摘し,外れ値検出手法を利用した対策案も提示する.
本年度は高度な確率密度比の算出法を用いて,昨年度に実装した共変量シフト下の学習手法を改善することを計画とした.計画に沿って研究を行い,国会会議において本研究に関する論文を1件発表した.その論文では確率密度比を線形モデルによりモデル化し,真の確率密度比と線形モデルとの二乗距離が最小になるようにパラメータを学習する拘束無し最小二乗重要度適合法という手法を用いた.そこで用いるカーネル関数は通常,ガウスカーネルであるが,ここでは線形カーネルを利用することを提案した.更に重み付き学習に通常の最大エントロピー法ではなく SVM を利用する方法も同時に利用することで,識別精度が向上した.更にそこで得られる重みを 2.0,1.0 及び 0.1 の大中小と大別する手法も提案した.最終的に利用するカーネル関数,重み付き学習,重みの大別処理の組み合わせを試し,最善の組み合わせを求めた.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究の目的は語義曖昧性解消の領域適応の問題に対して,共変量シフト下の学習を利用することである.現在まで計画通りに研究は進んでいる.これまでに提案する方向で対象としている問題が解決できることは示し,いくつかの研究発表を行っている.またそのうちの研究1件が論文誌に採択されている.更に本年度は高度な確率密度比の算出手法を用いることで識別精度が向上できることを示し,この研究は国際会議で発表した.これらの点からおおむね順調に進展しているといえる.

Strategy for Future Research Activity

本年度の研究を通して,語義曖昧性解消の領域適応の問題に対して共変量シフト下の学習を利用する際には,確率密度比の算出と重み付き学習の方法の他に,Misleading データの検出という問題が存在することが判明した.Misleading データとは識別精度を悪化させるようなラベル付きデータである.領域適応において生じる特徴的な問題である.また Misleading データの検出は訓練データ集合から,悪データを削除する形であるが,逆に訓練データ集合から,いくつかの善データを取り出して,善データのみで学習させるというアプローチも有望であることがわかった.Misleading データの検出法と同時に善データの検出法に関しても研究する.またどちらにおいても外れ値検出の手法が利用できると予想しており,来年度は外れ値検出の手法を利用することで,識別精度の改善を行う予定である.

Causes of Carryover

投稿はしたが採録されなかった国際会議論文が2件あった.計画ではその2件の国際会議への旅費として約30万円を充てていたが,採録されなかったために,それら国際会議への参加は見送った.そのために次年度使用額約30万円が生じた.

Expenditure Plan for Carryover Budget

採録されなかった国際会議論文を書き直し,別の国際会議に投稿する.ヨーロッパで開催される会議であるため,その旅費として次年度使用額約30万円をあてる.

  • Research Products

    (17 results)

All 2016 2015

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (16 results) (of which Int'l Joint Research: 6 results)

  • [Journal Article] クラスタリングを利用した語義曖昧性解消の誤り原因のタイプ分け2015

    • Author(s)
      新納浩幸,村田真樹,白井清昭,福本文代,藤田早苗,佐々木稔,古宮嘉那子,乾孝司
    • Journal Title

      自然言語処理

      Volume: 22-5 Pages: 319-362

    • Peer Reviewed
  • [Presentation] 類義語を利用した単語の分散表現から語義の分散表現の構築2016

    • Author(s)
      大内克之, 新納浩幸, 古宮嘉那子, 佐々木稔
    • Organizer
      言語処理学会第22回年次大会
    • Place of Presentation
      東北大学
    • Year and Date
      2016-03-07 – 2016-03-11
  • [Presentation] 分散表現から得た用例間類似度を素性に加えた語義曖昧性解消2016

    • Author(s)
      山木翔馬, 新納浩幸, 古宮嘉那子, 佐々木稔
    • Organizer
      言語処理学会第22回年次大会
    • Place of Presentation
      東北大学
    • Year and Date
      2016-03-07 – 2016-03-11
  • [Presentation] 分散表現に基づく日本語語義曖昧性解消における辞書定義文の有効性2016

    • Author(s)
      佐々木稔, 古宮嘉那子, 新納浩幸
    • Organizer
      言語処理学会第22回年次大会
    • Place of Presentation
      東北大学
    • Year and Date
      2016-03-07 – 2016-03-11
  • [Presentation] KyTea を利用した日本語 all-words WSD2016

    • Author(s)
      新納浩幸, 森信介, 古宮嘉那子, 佐々木稔
    • Organizer
      言語処理学会第22回年次大会
    • Place of Presentation
      東北大学
    • Year and Date
      2016-03-07 – 2016-03-11
  • [Presentation] 分散表現と文脈ベクトルによるオノマトぺの分類の比較2016

    • Author(s)
      古宮嘉那子, 佐々木稔, 新納浩幸
    • Organizer
      言語処理学会第22回年次大会
    • Place of Presentation
      東北大学
    • Year and Date
      2016-03-07 – 2016-03-11
  • [Presentation] 半教師あり学習と素性の重み付け学習の交互適用による文書分類の領域適応2016

    • Author(s)
      新納浩幸, 古宮嘉那子, 佐々木稔
    • Organizer
      言語処理学会第22回年次大会
    • Place of Presentation
      東北大学
    • Year and Date
      2016-03-07 – 2016-03-11
  • [Presentation] 概念辞書における子概念からの親概念の分散表現の推定2016

    • Author(s)
      大野達也, 古宮嘉那子, 佐々木稔, 新納浩幸
    • Organizer
      言語処理学会第22回年次大会
    • Place of Presentation
      東北大学
    • Year and Date
      2016-03-07 – 2016-03-11
  • [Presentation] 物語における登場人物の親しさ推定2016

    • Author(s)
      小井出慎, 古宮嘉那子, 佐々木稔, 新納浩幸
    • Organizer
      言語処理学会第22回年次大会
    • Place of Presentation
      東北大学
    • Year and Date
      2016-03-07 – 2016-03-11
  • [Presentation] all-words WSD のための概念辞書の自動作成2015

    • Author(s)
      新納浩幸,古宮嘉那子,佐々木稔
    • Organizer
      情報処理学会自然言語処理研究会
    • Place of Presentation
      名古屋工業大学
    • Year and Date
      2015-12-02 – 2015-12-04
  • [Presentation] 分散表現を用いた教師あり機械学習による語義曖昧性解消2015

    • Author(s)
      山木翔馬,新納浩幸,古宮嘉那子,佐々木稔
    • Organizer
      情報処理学会自然言語処理研究会
    • Place of Presentation
      名古屋工業大学
    • Year and Date
      2015-12-02 – 2015-12-04
  • [Presentation] Surrounding Word Sense Model for Japanese All-words Word Sense Disambiguation2015

    • Author(s)
      Kanako Komiya, Yuto Sasaki, Hajime Morita, Minoru Sasaki, Hiroyuki Shinnou and Yoshiyuki Kotani
    • Organizer
      PACLIC-29
    • Place of Presentation
      上海, 中国
    • Year and Date
      2015-10-30 – 2015-11-01
    • Int'l Joint Research
  • [Presentation] Learning under Covariate Shift for Domain Adaptation for Word Sense Disambiguation2015

    • Author(s)
      Hiroyuki Shinnou, Minoru Sasaki and Kanako Komiya
    • Organizer
      PACLIC-29
    • Place of Presentation
      上海, 中国
    • Year and Date
      2015-10-30 – 2015-11-01
    • Int'l Joint Research
  • [Presentation] Unsupervised Domain Adaptation for Word Sense Disambiguation using Stacked Denoising Autoencoder2015

    • Author(s)
      Kazuhei Kouno, Hiroyuki Shinnou, Minoru Sasaki and Kanako Komiya
    • Organizer
      PACLIC-29
    • Place of Presentation
      上海, 中国
    • Year and Date
      2015-10-30 – 2015-11-01
    • Int'l Joint Research
  • [Presentation] Hybrid Method of Semi-supervised Learning and Feature Weighted Learning for Domain Adaptation of Document Classification2015

    • Author(s)
      Hiroyuki Shinnou, Liying Xiao, Minoru Sasaki and Kanako Komiya
    • Organizer
      PACLIC-29
    • Place of Presentation
      上海, 中国
    • Year and Date
      2015-10-30 – 2015-11-01
    • Int'l Joint Research
  • [Presentation] Domain Adaptation with Filtering for Named Entity Extraction of Japanese Anime-Related Words2015

    • Author(s)
      Kanako Komiya, Daichi EDAMURA, Ryuta TAMURA, Minoru SASAKI, Hiroyuki SHINNOU and Yoshiyuki KOTANI
    • Organizer
      RANLP-2015
    • Place of Presentation
      Hissar, Bulgaria
    • Year and Date
      2015-09-05 – 2015-09-11
    • Int'l Joint Research
  • [Presentation] Active Learning to Remove Source Instances for Domain Adaptation for Word Sense Disambiguation2015

    • Author(s)
      Hiroyuki Shinnou, Yoshiyuki Onodera, Minoru Sasaki and Kanako Komiya
    • Organizer
      PACLING-2015
    • Place of Presentation
      Bali, Indonesia
    • Year and Date
      2015-05-19 – 2015-05-21
    • Int'l Joint Research

URL: 

Published: 2017-01-06  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi