• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

半教師有りクラスタリング手法を用いた語義別用例の収集

研究課題

研究課題/領域番号 19011001
研究種目

特定領域研究

配分区分補助金
審査区分 人文・社会系
研究機関茨城大学

研究代表者

新納 浩幸  茨城大学, 工学部, 准教授 (10250987)

研究分担者 佐々木 稔  茨城大学, 工学部, 講師 (60344834)
研究期間 (年度) 2007 – 2008
研究課題ステータス 完了 (2008年度)
配分額 *注記
4,400千円 (直接経費: 4,400千円)
2008年度: 2,000千円 (直接経費: 2,000千円)
2007年度: 2,400千円 (直接経費: 2,400千円)
キーワード半教師有り / クラスタリング / 語義別用例 / 能動学習 / 素性 / 距離学習 / 名詞間距離 / シソーラス
研究概要

本研究の目的は、語義別用例を収集するシステムを作成すること、またそのシステムを利用して、本領域で作成されるコーパスを評価することである。作成するシステムでは半教師有りクラスタリング手法を用いる。昨年度は手法の提案とシステムの作成を行った。本年度はシステムの改良及び精度向上のための研究を行った。また本領域で作成されたコーパスの評価も行った。システムの改良としては検索処理の部分を文字列から単語に直すことで、動詞に対する語義別用例も収集することができるようになった。また半教師の部分でユーザからの入力が必要であるが、その部分に以前の入力を修正する機能を付加した。またシステムの精度向上のためには、用例間距離の測定手法と名詞間の距離の設定手法が鍵であると考え、それらの研究に取り組んだ。用例間距離の測定手法としては線型モデルのパラメータ学習という枠組みを提案した。また名詞間の距離については部分的にクラスタリングされた名詞を種として、全名詞の対する距離を測定する手法を試みた。コーパスの評価としては、語義別用例を収集し、語義の曖昧性解消の学習や用例の語義に基づくクラスタリングで利用できるようにした。同時にコーパスの特徴も考察した。成果としては今年度、国際会議3件、研究会5件の論文発表を行った。

報告書

(2件)
  • 2008 実績報告書
  • 2007 実績報告書
  • 研究成果

    (19件)

すべて 2009 2008 2007 その他

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (15件) 図書 (1件) 備考 (2件)

  • [雑誌論文] NMFによる重み付きハイパーグラフを用いたアンサンブル文書クラスタリング2007

    • 著者名/発表者名
      新納, 浩幸・佐々木, 稔
    • 雑誌名

      自然言語処理 14

      ページ: 107-122

    • NAID

      10019822542

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [学会発表] 類似性の不明なデータを手がかりとして与えるクラスタリング手法2009

    • 著者名/発表者名
      佐々木稔, 松本良太, 新納浩幸
    • 学会等名
      DEIMフォーラム2009
    • 発表場所
      静岡県嬬恋リゾート
    • 年月日
      2009-03-09
    • 関連する報告書
      2008 実績報告書
  • [学会発表] 用例間類似度測定のための属性重みの推定2009

    • 著者名/発表者名
      新納浩幸, 佐々木稔
    • 学会等名
      言語処理学会第15回年次大会
    • 発表場所
      鳥取大学
    • 年月日
      2009-03-05
    • 関連する報告書
      2008 実績報告書
  • [学会発表] 商品説明文からの検索語に対する関連語抽出2009

    • 著者名/発表者名
      久保田敦, 佐々木稔, 新納浩幸
    • 学会等名
      言語処理学会第15回年次大会
    • 発表場所
      鳥取大学
    • 年月日
      2009-03-05
    • 関連する報告書
      2008 実績報告書
  • [学会発表] グラフクラスタリングによる単語用例クラスタリング2009

    • 著者名/発表者名
      相原功昌, 佐々木稔, 新納浩幸
    • 学会等名
      言語処理学会第15回年次大会
    • 発表場所
      鳥取大学
    • 年月日
      2009-03-05
    • 関連する報告書
      2008 実績報告書
  • [学会発表] 文書クラスタリングを対象としたWeighted Kernel K-meansの初期値設定法2009

    • 著者名/発表者名
      茂木哲矢, 新納浩幸, 佐々木稔
    • 学会等名
      言語処理学会第15回年次大会
    • 発表場所
      鳥取大学
    • 年月日
      2009-03-05
    • 関連する報告書
      2008 実績報告書
  • [学会発表] Ping-pong Document Clustering using NMF and Linkage-Based Refinement2008

    • 著者名/発表者名
      Hiroyuki Shinnou, Minoru Sasaki
    • 学会等名
      Language Resources and Evaluation (LREC) 2008
    • 発表場所
      マラケッシュ(モロッコ)
    • 年月日
      2008-05-28
    • 関連する報告書
      2008 実績報告書
  • [学会発表] Spectral Clustering for a Large Data Set by Reducing the Similarity Matrix Size2008

    • 著者名/発表者名
      Hiroyuki Shinnou, Minoru Sasaki
    • 学会等名
      Language Resources and Evaluation (LREC) 2008
    • 発表場所
      マラケッシュ(モロッコ)
    • 年月日
      2008-05-28
    • 関連する報告書
      2008 実績報告書
  • [学会発表] Division of Example Sentences Based on the Meaning of a Target Word Using Semi-supervised Clustering2008

    • 著者名/発表者名
      Hiroyuki Shinnou, Minoru Sasaki
    • 学会等名
      Language Resources and Evaluation (LREC) 2008
    • 発表場所
      マラケッシュ(モロッコ)
    • 年月日
      2008-05-28
    • 関連する報告書
      2008 実績報告書
  • [学会発表] 文書関連性を素性として追加した文書クラスタリング2008

    • 著者名/発表者名
      佐々木稔・新納浩幸
    • 学会等名
      言語処理学会第14回年次大会
    • 発表場所
      東京大学
    • 関連する報告書
      2007 実績報告書
  • [学会発表] Refinement of document clustering by using NMF2007

    • 著者名/発表者名
      Hiroyuki, Shinnou, Minoru, Sasaki
    • 学会等名
      PACLIC-21
    • 発表場所
      ソウル(韓国)
    • 関連する報告書
      2007 実績報告書
  • [学会発表] Ensemble Document Clustering Using Weighted Hypergraph Generated by NMF2007

    • 著者名/発表者名
      Hiroyuki, Shinnou, Minoru, Sasaki
    • 学会等名
      ACL
    • 発表場所
      プラハ(チェコ)
    • 関連する報告書
      2007 実績報告書
  • [学会発表] 縮類似度行列を用いたスペクトラル手法によるクラスタリング結果の改善2007

    • 著者名/発表者名
      新納浩幸・佐々木稔
    • 学会等名
      人工知能学会第79回知識ペースシステム研究会
    • 発表場所
      北海道
    • 関連する報告書
      2007 実績報告書
  • [学会発表] Webサイトの階層的なWebディレクトリヘの自動分類手法2007

    • 著者名/発表者名
      佐々木稔・新納浩幸
    • 学会等名
      情報処理学会第180回自然言語処理研究会
    • 発表場所
      徳島大学
    • 関連する報告書
      2007 実績報告書
  • [学会発表] 半教師有リクラスタリングを用いた語義数の推定と語義別用例の収集2007

    • 著者名/発表者名
      新納浩幸佐々木稔
    • 学会等名
      情報処理学会第180回自然言語処理研究会
    • 発表場所
      徳島大学
    • 関連する報告書
      2007 実績報告書
  • [学会発表] NMFとリンクベースの修正法によるピンポン型文書クラスタリング2007

    • 著者名/発表者名
      新納浩幸佐々木稔
    • 学会等名
      情報処理学会第179回自然言語処理研究会
    • 発表場所
      法政大学
    • 関連する報告書
      2007 実績報告書
  • [図書] Rで学ぶクラスタ解析2007

    • 著者名/発表者名
      新納浩幸
    • 総ページ数
      208
    • 出版者
      オーム出版
    • 関連する報告書
      2007 実績報告書
  • [備考]

    • URL

      http://info.ibaraki.ac.jp/scripts/websearch/index.htm

    • 関連する報告書
      2008 実績報告書
  • [備考] 茨城大学研究者情報総覧

    • URL

      http://info.ibaraki.ac.jp/scripts/websearch/index.htm

    • 関連する報告書
      2007 実績報告書

URL: 

公開日: 2007-04-01   更新日: 2018-03-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi