• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

縮約類似度行列を用いた大規模文書データに対するスペクトラルクラスタリング

研究課題

研究課題/領域番号 20500124
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関茨城大学

研究代表者

新納 浩幸  茨城大学, 工学部, 准教授 (10250987)

研究期間 (年度) 2008 – 2010
研究課題ステータス 完了 (2010年度)
配分額 *注記
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2010年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2009年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2008年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
キーワード縮約類似度行列 / スペクトラルクラスタリング / 文書クラスタリング / 距離学習 / 最大マージン化最近傍法 / 大規模データ / コミッティ / 名詞間距離 / シソーラス
研究概要

本研究では大規模文書クラスタリングにスペクトラルクラスタリングを用いる手法を開発した。基本的には大規模データをk-meansで予め小規模クラスタに分割し、そこから信頼度の高いデータを抽出し、それらデータに対して類似度行列を作る。作成された類似度行列は縮約されているので、スペクトラルクラスタリングが実行できる。クラスタリングの更なる精度向上のために、精緻な名詞間距離の測定法や、文書間の距離学習法の開発も行った。

報告書

(4件)
  • 2010 実績報告書   研究成果報告書 ( PDF )
  • 2009 実績報告書
  • 2008 実績報告書
  • 研究成果

    (24件)

すべて 2011 2010 2009 2008 その他

すべて 学会発表 (22件) 備考 (2件)

  • [学会発表] 距離学習に基づく語義識別の性能分析2011

    • 著者名/発表者名
      佐々木稔,新納浩幸
    • 学会等名
      言語処理学会第17回年次大会
    • 発表場所
      豊橋(E2-7)
    • 年月日
      2011-03-11
    • 関連する報告書
      2010 研究成果報告書
  • [学会発表] 教師付き外れ値検出による新語義の発見2011

    • 著者名/発表者名
      新納浩幸, 佐々木稔
    • 学会等名
      言語処理学会第17回年次大会
    • 発表場所
      豊橋技術科学大学
    • 年月日
      2011-03-10
    • 関連する報告書
      2010 実績報告書
  • [学会発表] 距離学習に基づく語義識別の性能分析2011

    • 著者名/発表者名
      佐々木稔, 新納浩幸
    • 学会等名
      言語処理学会第17回年次大会
    • 発表場所
      豊橋技術科学大学
    • 年月日
      2011-03-09
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Document Clustering Using Semantic Relationship Between Target Documents And Related Documents2010

    • 著者名/発表者名
      Minoru Sasaki, Hiroyuki Shinnou
    • 学会等名
      The Fourth International Conference on Advances in Semantic Processing
    • 発表場所
      フィレンツェ(イタリア)(91-95)
    • 年月日
      2010-10-25
    • 関連する報告書
      2010 研究成果報告書
  • [学会発表] Document Clustering Using Semantic Relationship Between Target Documents And Related Documents2010

    • 著者名/発表者名
      Minoru Sasaki, Hiroyuki Shinnou
    • 学会等名
      The Fourth International Conference on Advances in Semantic Processing
    • 発表場所
      Novotel Firenze Nord Aeroportoホテル(フィレンツェ, イタリア)
    • 年月日
      2010-10-25
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Detection of Peculiar Examples using LOF and One Class SVM2010

    • 著者名/発表者名
      Hiroyuki Shinnou, Minoru Sasaki
    • 学会等名
      LREC-2010
    • 発表場所
      バレッタ(マルタ共和国)
    • 年月日
      2010-05-20
    • 関連する報告書
      2010 研究成果報告書
  • [学会発表] Detection of Peculiar Examples using LOF and One Class SVM2010

    • 著者名/発表者名
      Hiroyuki Shinnou, Minoru Sasaki
    • 学会等名
      The seventh international conference on Language Resources and Evaluation
    • 発表場所
      地中海会議センター(バレッタ, マルタ共和国)
    • 年月日
      2010-05-20
    • 関連する報告書
      2010 実績報告書
  • [学会発表] Webディレクトリを利用した意味的関連語集合の作成2010

    • 著者名/発表者名
      佐々木稔, 三上健太, 新納浩幸
    • 学会等名
      言語処理学会第16回年次大会
    • 発表場所
      東京大学
    • 年月日
      2010-03-11
    • 関連する報告書
      2009 実績報告書
  • [学会発表] Webディレクトリを利用した名詞のジャンルベクトルの作成2010

    • 著者名/発表者名
      林華, 新納浩幸, 佐々木稔
    • 学会等名
      言語処理学会第16回年次大会
    • 発表場所
      東京大学
    • 年月日
      2010-03-10
    • 関連する報告書
      2009 実績報告書
  • [学会発表] LOFとOne Class SVMを用いた特異用例の検出2010

    • 著者名/発表者名
      新納浩幸, 佐々木稔
    • 学会等名
      言語処理学会第16回年次大会
    • 発表場所
      東京大学
    • 年月日
      2010-03-10
    • 関連する報告書
      2009 実績報告書
  • [学会発表] 名詞の主要語義の推定と語義識別への応用2010

    • 著者名/発表者名
      江口晃, 新納浩幸, 佐々木稔
    • 学会等名
      言語処理学会第16回年次大会
    • 発表場所
      東京大学
    • 年月日
      2010-03-10
    • 関連する報告書
      2009 実績報告書
  • [学会発表] 文書クラスタリングを対象としたWeighted Kernel K-meansの初期値設定法2009

    • 著者名/発表者名
      茂木哲矢,新納浩幸,佐々木稔
    • 学会等名
      言語処理学会第15回年次大会
    • 発表場所
      鳥取(D4-5)
    • 年月日
      2009-03-05
    • 関連する報告書
      2010 研究成果報告書
  • [学会発表] 用例間類似度測定のための属性重みの推定2009

    • 著者名/発表者名
      新納浩幸, 佐々木稔
    • 学会等名
      言語処理学会第15回年次大会
    • 発表場所
      鳥取大学
    • 関連する報告書
      2008 実績報告書
  • [学会発表] 商品説明文からの検索語に対する関連語抽出2009

    • 著者名/発表者名
      久保田敦, 佐々木稔, 新納浩幸
    • 学会等名
      言語処理学会第15回年次大会
    • 発表場所
      鳥取大学
    • 関連する報告書
      2008 実績報告書
  • [学会発表] グラフクラスタリングによる単語用例クラスタリング2009

    • 著者名/発表者名
      相原功昌, 佐々木稔, 新納浩幸
    • 学会等名
      言語処理学会第15回年次大会
    • 発表場所
      鳥取大学
    • 関連する報告書
      2008 実績報告書
  • [学会発表] 文書クラスタリングを対象としたWeighted Kernel K-meansの初期値設定法2009

    • 著者名/発表者名
      茂木哲矢, 新納浩幸, 佐々木稔
    • 学会等名
      言語処理学会第15回年次大会
    • 発表場所
      鳥取大学
    • 関連する報告書
      2008 実績報告書
  • [学会発表] 類似性の不明なデータを手がかりとして与えるクラスタリング手法2009

    • 著者名/発表者名
      佐々木稔, 松本良太, 新納浩幸
    • 学会等名
      DEIMフォーラム2009
    • 発表場所
      静岡県嬬恋リゾート
    • 関連する報告書
      2008 実績報告書
  • [学会発表] Spectral Clustering for a Large Data Set by Reducing the Similarity Matrix Size2008

    • 著者名/発表者名
      Hiroyuki Shinnou, Minoru Sasaki
    • 学会等名
      LREC-2008
    • 発表場所
      マラケッシュ(モロッコ)
    • 年月日
      2008-05-28
    • 関連する報告書
      2010 研究成果報告書
  • [学会発表] Ping-pong Document Clustering using NMF and Linkage-Based Refinement2008

    • 著者名/発表者名
      Hiroyuki Shinnou, Minoru Sasaki
    • 学会等名
      LREC-2008
    • 発表場所
      マラケッシュ(モロッコ)
    • 年月日
      2008-05-28
    • 関連する報告書
      2010 研究成果報告書
  • [学会発表] Ping-pong Document Clustering using NMF and Linkage-Based Refinement2008

    • 著者名/発表者名
      Hiroyuki Shinnou, Minoru Sasaki
    • 学会等名
      Language Resources and Evaluation (LREC) 2008
    • 発表場所
      マラケッシュ(モロッコ)
    • 関連する報告書
      2008 実績報告書
  • [学会発表] Spectral Clustering for a Large Data Set by Reducing the Similarity Matrix Size2008

    • 著者名/発表者名
      Hiroyuki Shinnou, Minoru Sasaki
    • 学会等名
      Language Resources and Evaluation (LREC) 2008
    • 発表場所
      マラケッシュ(モロッコ)
    • 関連する報告書
      2008 実績報告書
  • [学会発表] Division of Example Sentences Based on the Meaning of a Target Word Using Semi-supervised Clustering2008

    • 著者名/発表者名
      Hiroyuki Shinnou, Minoru Sasaki
    • 学会等名
      Language Resources and Evaluation (LREC) 2008
    • 発表場所
      マラケッシュ(モロッコ)
    • 関連する報告書
      2008 実績報告書
  • [備考]

    • URL

      http://info.ibaraki.ac.jp/script/websearch/index.htm

    • 関連する報告書
      2009 実績報告書
  • [備考]

    • URL

      http://info.ibaraki.ac.jp/scripts/websearch/index.htm

    • 関連する報告書
      2008 実績報告書

URL: 

公開日: 2008-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi