• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2004 Fiscal Year Annual Research Report

語義判別問題に対する教師なし学習に関する研究

Research Project

Project/Area Number 15500083
Research InstitutionIBARAKI UNIVERSITY

Principal Investigator

新納 浩幸  茨城大学, 工学部, 助教授 (10250987)

Keywords教師なし学習 / ファジークラスタリング / EMアルゴリズム / ベイジアンネットワーク / 語義判別問題 / SENSEVAL-2
Research Abstract

自然言語処理の個々の問題を分類問題に定式化し,帰納学習手法を用いて解決するというアプローチは大きな成功をおさめている.しかしこのアプローチは,大量のラベル付き訓練データを必要とし,その構築コストが高いという問題がある.本研究ではこの問題の解決のために,教師なし学習を試みる.本研究で扱うタスクは語義判別問題に限定する.
昨年度は主にEMアルゴリズムの利用を検討した.特にEMアルゴリズムを適用する際に問題となる最適な繰り返しの推定について新たな手法を提案した.またベイジアンネットの利用も検討した.
本年度は,まず,クラスタリングに焦点を当てた.EMアルゴリズムも一種のクラスタリングの手法であることから,EMアルゴリズムで解決可能な教師なし学習はより一般的にクラスタリングの手法を用いても解決可能である.本研究ではファジィクラスタリングを用いて昨年度と同じ課題に取り組んだ.結論的にはEMアルゴリズムを用いた方がよい結果となった.語義判別問題では事例の次元数が非常に大きくなるために,実数空間上の距離を基本とするクラスタリングではよい精度が得られないことがわかった.この成果を研究会と国際会議で発表した.
また,教師なし学習は通常の帰納学習が大量のラベル付き訓練データを必要とするという問題点の解決から考案されているが,この問題に対しては能動学習を用いるというアプローチもある.本年度は能動学習の利用についても検討を行った.能動学習には標準的にはQBC(Query By Committee)という手法を用いるが,期待損失の考えを応用する研究もあり,本年度はQBCと期待損失を用いた手法を同音異義語問題(本質的には語義判別問距)に適用して比較,考察した.この成果を研究会で発表した.

  • Research Products

    (6 results)

All 2004

All Journal Article (5 results) Book (1 results)

  • [Journal Article] Semi-supervised learning by Fuzzy clustering and Ensemble learning2004

    • Author(s)
      H.Shinnou, M.Sasaki
    • Journal Title

      LREC-2004

      Pages: 399-402

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] Webページ内の目的部分の自動抽出2004

    • Author(s)
      新納浩幸, 佐々木稔
    • Journal Title

      情報処理学会自然言語処理研究会 163-6

      Pages: 30-40

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] 決定リストと期待損失を用いた同音異義語識別規則の能動学習2004

    • Author(s)
      紺野憲一, 新納浩幸, 佐々木稔
    • Journal Title

      言語処理学会第10回年次大会

      Pages: 757-760

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] 語義識別の誤り原因の調査とオンザフライの類似語判定2004

    • Author(s)
      藤井丈明, 新納浩幸, 佐々木稔
    • Journal Title

      言語処理学会第10回年次大会

      Pages: 753-756

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] 検索エンジンを利用した単語クラスタリング2004

    • Author(s)
      大城亜里沙, 新納浩幸, 佐々木稔
    • Journal Title

      言語処理学会第10回年次大会

      Pages: 17-20

    • Description
      「研究成果報告書概要(和文)」より
  • [Book] 数理統計学の基礎2004

    • Author(s)
      新納浩幸
    • Total Pages
      175
    • Publisher
      森北出版
    • Description
      「研究成果報告書概要(和文)」より

URL: 

Published: 2006-07-12   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi