• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2008 Fiscal Year Annual Research Report

半教師有りクラスタリング手法を用いた語義別用例の収集

Research Project

Project/Area Number 19011001
Research InstitutionIbaraki University

Principal Investigator

新納 浩幸  Ibaraki University, 工学部, 准教授 (10250987)

Co-Investigator(Kenkyū-buntansha) 佐々木 稔  茨城大学, 工学部, 講師 (60344834)
Keywords半教師有り / クラスタリング / 語義別用例 / 能動学習 / 素性 / 距離学習 / 名詞間距離 / シソーラス
Research Abstract

本研究の目的は、語義別用例を収集するシステムを作成すること、またそのシステムを利用して、本領域で作成されるコーパスを評価することである。作成するシステムでは半教師有りクラスタリング手法を用いる。昨年度は手法の提案とシステムの作成を行った。本年度はシステムの改良及び精度向上のための研究を行った。また本領域で作成されたコーパスの評価も行った。システムの改良としては検索処理の部分を文字列から単語に直すことで、動詞に対する語義別用例も収集することができるようになった。また半教師の部分でユーザからの入力が必要であるが、その部分に以前の入力を修正する機能を付加した。またシステムの精度向上のためには、用例間距離の測定手法と名詞間の距離の設定手法が鍵であると考え、それらの研究に取り組んだ。用例間距離の測定手法としては線型モデルのパラメータ学習という枠組みを提案した。また名詞間の距離については部分的にクラスタリングされた名詞を種として、全名詞の対する距離を測定する手法を試みた。コーパスの評価としては、語義別用例を収集し、語義の曖昧性解消の学習や用例の語義に基づくクラスタリングで利用できるようにした。同時にコーパスの特徴も考察した。成果としては今年度、国際会議3件、研究会5件の論文発表を行った。

  • Research Products

    (9 results)

All 2009 2008 Other

All Presentation (8 results) Remarks (1 results)

  • [Presentation] 類似性の不明なデータを手がかりとして与えるクラスタリング手法2009

    • Author(s)
      佐々木稔, 松本良太, 新納浩幸
    • Organizer
      DEIMフォーラム2009
    • Place of Presentation
      静岡県嬬恋リゾート
    • Year and Date
      2009-03-09
  • [Presentation] 用例間類似度測定のための属性重みの推定2009

    • Author(s)
      新納浩幸, 佐々木稔
    • Organizer
      言語処理学会第15回年次大会
    • Place of Presentation
      鳥取大学
    • Year and Date
      2009-03-05
  • [Presentation] 商品説明文からの検索語に対する関連語抽出2009

    • Author(s)
      久保田敦, 佐々木稔, 新納浩幸
    • Organizer
      言語処理学会第15回年次大会
    • Place of Presentation
      鳥取大学
    • Year and Date
      2009-03-05
  • [Presentation] グラフクラスタリングによる単語用例クラスタリング2009

    • Author(s)
      相原功昌, 佐々木稔, 新納浩幸
    • Organizer
      言語処理学会第15回年次大会
    • Place of Presentation
      鳥取大学
    • Year and Date
      2009-03-05
  • [Presentation] 文書クラスタリングを対象としたWeighted Kernel K-meansの初期値設定法2009

    • Author(s)
      茂木哲矢, 新納浩幸, 佐々木稔
    • Organizer
      言語処理学会第15回年次大会
    • Place of Presentation
      鳥取大学
    • Year and Date
      2009-03-05
  • [Presentation] Ping-pong Document Clustering using NMF and Linkage-Based Refinement2008

    • Author(s)
      Hiroyuki Shinnou, Minoru Sasaki
    • Organizer
      Language Resources and Evaluation (LREC) 2008
    • Place of Presentation
      マラケッシュ(モロッコ)
    • Year and Date
      2008-05-28
  • [Presentation] Spectral Clustering for a Large Data Set by Reducing the Similarity Matrix Size2008

    • Author(s)
      Hiroyuki Shinnou, Minoru Sasaki
    • Organizer
      Language Resources and Evaluation (LREC) 2008
    • Place of Presentation
      マラケッシュ(モロッコ)
    • Year and Date
      2008-05-28
  • [Presentation] Division of Example Sentences Based on the Meaning of a Target Word Using Semi-supervised Clustering2008

    • Author(s)
      Hiroyuki Shinnou, Minoru Sasaki
    • Organizer
      Language Resources and Evaluation (LREC) 2008
    • Place of Presentation
      マラケッシュ(モロッコ)
    • Year and Date
      2008-05-28
  • [Remarks]

    • URL

      http://info.ibaraki.ac.jp/scripts/websearch/index.htm

URL: 

Published: 2010-06-11   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi