• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2007 年度 実績報告書

時系列多重トピックモデルによる情報共有法の研究

研究課題

研究課題/領域番号 19300032
研究機関国立情報学研究所

研究代表者

高須 淳宏  国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)

研究分担者 相原 健郎  国立情報学研究所, コンテンツ科学研究系, 准教授 (90300706)
キーワードテキスト処理 / トピックモデル / 機械学習
研究概要

本研究は、複数の人間が係わるプロジェクトで生成・収集される各種情報を共有し活用するための情報共有システムの構築法を考案することを目的としている。特に時間情報を考慮した、時系列文書の処理技術に焦点をあてて、情報共有システムを構築することをめざしている。
平成19年度は、まず、大規模な時系列文書モデルを構築するために、文書からの各種の属性を抽出するための情報抽出法の研究を進めた。文書のレイアウトや構文構造に基づいて重要な情報を抽出すための、ページ文法の提案とその効率的な構文解析アルゴリズムを行った。次に、文書に現れる重要な情報を文書間で結び付けるための近似マッチングアルゴリズムの検討をおこなった。この研究では、類似度を計算するための統計的なモデルのパラメタをベイズ学習するためのGibbsサンプリングに基づくアルゴリズムを開発した。開発したアルゴリズムは、Gibbsさらに、時系列文書モデルの基礎をなす潜在トピックに基づいた確率モデルの検討とそのモデルを獲得するためのアルゴリズムの開発をすすめた。

  • 研究成果

    (4件)

すべて 2008 2007

すべて 学会発表 (4件)

  • [学会発表] Information Extraction from Scanned Documents by Stochastic Page Lavout Analysis2008

    • 著者名/発表者名
      Atsuhiro Takasu, Kenro Aihara
    • 学会等名
      ACM Symposium on Applied Computing
    • 発表場所
      フォルタレーザ、ブラジル
    • 年月日
      20080300
  • [学会発表] Statistical Learning Algorithm for Tree Similarity2007

    • 著者名/発表者名
      Atsuhiro Takasu, Daiji Fukagawa, Tatsuya Akutsu
    • 学会等名
      IEEE International Conference on Data Mining
    • 発表場所
      米国、ネブラスカ
    • 年月日
      20071000
  • [学会発表] A Smoothing Method for a Statistical String Similarity2007

    • 著者名/発表者名
      Atsuhiro Takasu, Kenro Aihara, Taizo Yamada
    • 学会等名
      IEEE International Conference on Information Reuse and Integration
    • 発表場所
      米国、ラスベガス
    • 年月日
      20070800
  • [学会発表] UpdateNews: A News Clustering and Summarization System Using Efficient Text Processing2007

    • 著者名/発表者名
      Takaharu Takeda, Atsuhiro Takasu
    • 学会等名
      ACM IEEE Joint Conference on Digital Libraries
    • 発表場所
      カナダ、バンクーバー
    • 年月日
      20070600

URL: 

公開日: 2010-06-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi