• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

統計学的ライムを利用した情報ナビゲーション

研究課題

研究課題/領域番号 22700150
研究種目

若手研究(B)

配分区分補助金
研究分野 知能情報学
研究機関長崎大学

研究代表者

正田 備也  長崎大学, 大学院・工学研究科, 准教授 (60413928)

研究期間 (年度) 2010 – 2011
研究課題ステータス 完了 (2011年度)
配分額 *注記
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2011年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2010年度: 3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
キーワードデータマイニング / 確率モデル / ベイズ理論 / トピックモデル / 並列化 / 知能情報学
研究概要

本研究は、「意味的な関連性によるのではない単語の共起関係であっても,統計学的に有意な頻度で生じているならば情報収集の手掛かりとして有用性を持つ」という仮定に基づいている。この、統計学的に有意な頻度で生じる共起を、「統計学的ライム」と呼ぶ。そして、ベイズ的な確率モデルを使い、統計学的に有意な頻度で生じている単語の共起関係を抽出することを目指した。最終的に、論文末尾や研究者のWebサイトに現れる書誌情報を、著者名・論文タイトル・学術雑誌名・発表年など異なる書誌フィールドへと教師無し学習によって自動分割する、新しいLDA(潜在的ディリクレ配分法)タイプのトピック抽出法を提案できた。また、提案のモデルの分割精度を半教師付き学習により改善することに成功した。

報告書

(3件)
  • 2011 実績報告書   研究成果報告書 ( PDF )
  • 2010 実績報告書
  • 研究成果

    (10件)

すべて 2011 2010 その他

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (6件) 備考 (2件)

  • [雑誌論文] 潜在的置換による書誌要素の教師無し分割2011

    • 著者名/発表者名
      正田備也
    • 雑誌名

      IJOCI

      巻: 第2巻、第2号 ページ: 49-62

    • 関連する報告書
      2011 研究成果報告書
    • 査読あり
  • [雑誌論文] Unsupervised Segmentation of Bibliographic Elements with Latent Permutations2011

    • 著者名/発表者名
      正田備也
    • 雑誌名

      IJOCI : International Journal of Organizational and Collective Intelligence

      巻: 2

    • NAID

      120006985287

    • 関連する報告書
      2010 実績報告書
    • 査読あり
  • [学会発表] 潜在的置換による書誌要素の半教師付き分割2011

    • 著者名/発表者名
      正田備也、高須淳宏、柴田裕一郎、小栗清
    • 学会等名
      シュプリンガー・レクチャー・ノーツ・イン・コンピュータ・サイエンス
    • 年月日
      2011-10-25
    • 関連する報告書
      2011 研究成果報告書
  • [学会発表] Semi-supervised Bibliographic Element Segmentation with Latent Permutations2011

    • 著者名/発表者名
      正田備也、高須淳宏、柴田裕一郎、小栗清
    • 学会等名
      International Conference on Asia-Pacific Digital Libraries (ICADL 2011)
    • 発表場所
      北京
    • 年月日
      2011-10-25
    • 関連する報告書
      2011 実績報告書
  • [学会発表] Documents as a Bag of Maximal Substrings : An Unsupervised Feature Extraction for Document Clustering2011

    • 著者名/発表者名
      正田備也、柴田裕一郎、小栗清
    • 学会等名
      13th International Conference on Enterprise Information Systems
    • 発表場所
      北京
    • 年月日
      2011-06-10
    • 関連する報告書
      2011 実績報告書
  • [学会発表] Steering Time-Dependent Estimation of Posteriors with Hyperparameter Indexing in Bayesian Topic Models2011

    • 著者名/発表者名
      正田備也、高須淳宏、柴田裕一郎、小栗清
    • 学会等名
      15th Pacific-Asia Conference on Knowledge Discovery and Data Mining
    • 発表場所
      深〓
    • 年月日
      2011-05-27
    • 関連する報告書
      2011 実績報告書
  • [学会発表] 潜在的置換による書誌要素の教師無し分割2010

    • 著者名/発表者名
      正田備也、柴田裕一郎、小栗清
    • 学会等名
      シュプリンガー・レクチャー・ノーツ・イン・コンピュータ・サイエンス
    • 年月日
      2010-12-12
    • 関連する報告書
      2011 研究成果報告書
  • [学会発表] Unsupervised Segmentation of Bibliographic Elements with Latent Permutations2010

    • 著者名/発表者名
      正田備也、柴田裕一郎、小栗清
    • 学会等名
      International Symposium on Web Intelligent Systems & Services
    • 発表場所
      香港
    • 年月日
      2010-12-12
    • 関連する報告書
      2010 実績報告書
  • [備考] 以下は、本研究の成果を含む内容が表示されている、研究代表者のWebサイトである。

    • URL

      http://diversity-mining-lab.wikispaces.com/

    • 関連する報告書
      2011 研究成果報告書
  • [備考]

    • URL

      http://diversity-mining-lab.wikispaces.com/

    • 関連する報告書
      2011 実績報告書

URL: 

公開日: 2010-08-23   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi