• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2004 年度 実績報告書

データストリームからの知識獲得に関する研究

研究課題

研究課題/領域番号 16500070
研究機関法政大学

研究代表者

三浦 孝夫  法政大学, 工学部, 教授 (00219586)

研究分担者 塩谷 勇  産能大学, 経営情報学部, 教授 (70170850)
キーワード不完全データの時間推定 / EMアルゴリズム / 逐次クラスタリング / データプロジェクション / ランダムプロジェクション / スキュープロジェクション / テキストストリーム / 多次元データ操作
研究概要

本年度は研究初年度としてデータモデル確率のための基本技術の確立を目指した。データストリームをデータベースの観点から捕らえると、型やクラスという構造情報を事前に決定できないという問題がある。このため、データ自身から記述情報を生成するという知識生成手法の内在が必須である。このための動的モデル化手法として、伝統的には"分類"と"要約"があげられるが,本年度ではそのためにデータの時間推定と高性能検索の実現を果たすことを目的とした。具体的に、本研究では大きく3つの特徴を捉えた発展を行った。
(1)オンラインニュース等の時系列文書の要約や,新しい話題の検出や追跡を行う研究が盛んに行われている.しかし,それらのほとんどでは,各記事のタイムスタンプ(発行時間)が取得可能であることを前提としており,タイムスタンプが不明な記事はこれらのタスクには貢献できない.また複数のソースを扱う場合,ソース間に速報性の差による割り当ての矛盾が生じる.
本研究では,ニュース記事のタイムスタンプを少数の不完全なデータから,効果的に推定する手法を提案する.EMアルゴリズムや逐次的なクラスタリング手法を用いることにより,記事が述べている事象に基づきタイムスタンプを推定する.TDT2コーパスを用いた実験により本手法の有効性と考察を示している.
(2)近年注目されているプロジェクション手法にランダムプロジェクション(RP)がある.RP手法ではランダムな要素で射影行列を構成する.そのため行列の作成が高速で,プロジェクションがデータに対して独立である.データに独立なプロジェクションは射影行列の再計算が不要で,例えばデータストリームに対しては検索効率と検索精度の両立が可能となる.しかし,そのランダム性ゆえに,特に低次元でプロジェクションの安定性が低下する問題がある.本研究では,文書データの単語分布を元に射影行列を構成するプロジェクション手法(Skewed Projection : SP)を提案している.ランダムプロジェクションによる文書検索では,特に低次元で検索の安定性が低下する.本研究では,単語の頻度分布に基づいて射影行列を構成する.このプロジェクションを用いることにより,誤差を保存しつつ,分布に特有な応用分野に属する文書集合に対して,局所的に非依存かつ効率的な文書検索が行えることを示した.
(3)多次元データ構造との関連で数万次元に及ぶテキストデータにプロジェクション手法を用い、高性能な検索を行うための手法EGF(拡張可能ハッシュファイル)の提案と性能評価について実現可能性を示した。

  • 研究成果

    (21件)

すべて 2005 2004

すべて 雑誌論文 (21件)

  • [雑誌論文] 拡張可能グリッドファイルにおける最近傍検索の改善2005

    • 著者名/発表者名
      三好 涼介, 三浦 孝夫, 塩谷 勇
    • 雑誌名

      電子情報通信学会論文誌(D1) J88-D-I-3

      ページ: 727-734

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 記述論理を用いたUML整合性の検証システムの構成と実現2005

    • 著者名/発表者名
      中西啓之, 三浦孝夫, 塩谷勇
    • 雑誌名

      データ工学ワークショップ(DEWS),電子情報通信学会データ工学研究会 (CDROM)

      ページ: 1A-o4

  • [雑誌論文] 不完全なニュース集合からのタイムスタンプ推定2005

    • 著者名/発表者名
      上嶋宏, 三浦孝夫, 塩谷勇
    • 雑誌名

      データ工学ワークショップ(DEWS),電子情報通信学会データ工学研究会 (CDROM)

      ページ: 3C-o4

  • [雑誌論文] 頻度分布に基づくプロジェクションを用いた文書検索2005

    • 著者名/発表者名
      大内浩仁, 三浦孝夫, 塩谷勇
    • 雑誌名

      データ工学ワークショップ(DEWS),電子情報通信学会データ工学研究会 (CDROM)

      ページ: 1C-i8

  • [雑誌論文] EMアルゴリズムを用いた旋律分類2005

    • 著者名/発表者名
      吉原幸輝, 三浦孝夫
    • 雑誌名

      データ工学ワークショップ(DEWS),電子情報通信学会データ工学研究会 (CDROM)

      ページ: 1C-o3

  • [雑誌論文] Suffix Tree Clusteringを用いたWebページ集合のラベル付け2005

    • 著者名/発表者名
      森正輝, 三浦孝夫, 塩谷勇
    • 雑誌名

      データ工学ワークショップ(DEWS),電子情報通信学会データ工学研究会 (CDROM)

      ページ: 5C-o2

  • [雑誌論文] 次元縮小を用いた拡張可能グリッドファイルによる高次元データの検索2005

    • 著者名/発表者名
      三好涼介, 三浦孝夫, 塩谷勇
    • 雑誌名

      データ工学ワークショップ(DEWS),電子情報通信学会データ工学研究会 (CDROM)

      ページ: 2A-i8

  • [雑誌論文] ハイパーリンクの共起性を用いたクラスタリング手法2005

    • 著者名/発表者名
      高橋功, 三浦孝夫
    • 雑誌名

      データ工学ワークショップ(DEWS),電子情報通信学会データ工学研究会 (CDROM)

      ページ: 1C-i12

  • [雑誌論文] 単一系列データ上の系列選択パターンと逆単調性2005

    • 著者名/発表者名
      清水一宏, 三浦孝夫
    • 雑誌名

      データ工学ワークショップ(DEWS),電子情報通信学会データ工学研究会 (CDROM)

      ページ: 3C-i8

  • [雑誌論文] Retrieval for Text Stream by Random Projection2004

    • 著者名/発表者名
      大内 浩仁, 三浦 孝夫, 塩谷 勇
    • 雑誌名

      International conference on Information Systems Technology and its Applications (ISTA)

      ページ: 151-164

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Pre-pruning Decision Trees By Local Association Rules2004

    • 著者名/発表者名
      高光 智哉, 三浦 孝夫, 塩谷 勇
    • 雑誌名

      Intelligent Data Engineering and Automated Learning (IDEAL)

      ページ: 148-151

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Querying Spatial Data on Extensible Grid Files2004

    • 著者名/発表者名
      三好 涼介, 三浦 孝夫, 塩谷 勇
    • 雑誌名

      ACM Workshop on Multimedia Information Systems (MIS04)

      ページ: 86-95

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Giving Temporal Order to News Corpus (Extended Abstract)2004

    • 著者名/発表者名
      上島 宏, 三浦 孝夫, 塩谷 勇
    • 雑誌名

      International Symposium on Computational and Information Sciences (CIS04)

      ページ: 947-953

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 拡張可能グリッドファイルにおける最近傍検索の改善2004

    • 著者名/発表者名
      三好 涼介, 三浦 孝夫, 塩谷 勇
    • 雑誌名

      データベースワークショップ(DBWS04),信学技法 V104-176

      ページ: 43-48

  • [雑誌論文] Webからの時制クラスタの解釈2004

    • 著者名/発表者名
      森 正輝, 三浦 孝夫, 塩谷 勇
    • 雑誌名

      データベースワークショップ(DBWS04),信学技法 v.104-178

      ページ: 97-102

  • [雑誌論文] Formalizing UML Collaborations by using Description Logics2004

    • 著者名/発表者名
      中西 啓之, 三浦 孝夫, 塩谷 勇
    • 雑誌名

      "Alternative Approaches in Software Engineering" in IEEE International Conference on Computational Cybernetics (CDROM)

  • [雑誌論文] Webからの時制クラスタの解釈2004

    • 著者名/発表者名
      森 正輝, 三浦 孝夫, 塩谷 勇
    • 雑誌名

      日本データベース学会Letters (DBSJ Letters) 3-2

      ページ: 109-112

  • [雑誌論文] Giving Temporal Order to News Corpus2004

    • 著者名/発表者名
      上島 宏, 三浦 孝夫, 塩谷 勇
    • 雑誌名

      International Conf. on Tools with Artificial Intelligence (ICTAI) (CDROM)

  • [雑誌論文] Extracting Events From Web Pages2004

    • 著者名/発表者名
      森 正輝, 三浦 孝夫, 塩谷 勇
    • 雑誌名

      International Conference on Advances in Intelligent Systems - Theory and Applications (AISTA) (CDROM)

  • [雑誌論文] Looking Up Files in Peer-to-Peer Using Hierarchical Bloom Filters2004

    • 著者名/発表者名
      三橋 孝平, 三浦 孝夫, 塩谷 勇
    • 雑誌名

      International Symposium on Computational and Information Sciences (CIS04)

      ページ: 982-988

  • [雑誌論文] ランダムプロジェクションを用いたニュースストリームの検索2004

    • 著者名/発表者名
      大内 浩仁, 三浦 孝夫, 塩谷 勇
    • 雑誌名

      日本データベース学会Letters (DBSJ Letters) 3-3

      ページ: 1-4

URL: 

公開日: 2006-07-12   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi