• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

超高速データストリームのためのオンライン型半構造情報変換システムの開発

研究課題

研究課題/領域番号 16650021
研究種目

萌芽研究

配分区分補助金
研究分野 メディア情報学・データベース
研究機関九州工業大学 (2005)
北海道大学 (2004)

研究代表者

坂本 比呂志 (2005)  九州工業大学, 情報工学部, 助教授 (50315123)

有村 博紀 (2004)  北海道大学, 大学院・情報科学研究科, 教授 (20222763)

研究分担者 坂本 比呂志  九州工業大学, 情報工学部, 助教授 (50315123)
研究期間 (年度) 2004 – 2005
研究課題ステータス 完了 (2005年度)
配分額 *注記
2,500千円 (直接経費: 2,500千円)
2005年度: 900千円 (直接経費: 900千円)
2004年度: 1,600千円 (直接経費: 1,600千円)
キーワードデータストリーム / 半構造データ / オンラインアルゴリズム / 情報抽出 / パターン発見 / XML / XPath / 情報検索 / ストリーム / 文法圧縮 / 圧縮索引 / SAX
研究概要

本研究では,半構造データに対する高速なXPath処理法を提案した.これまでに,データを効率的に圧縮する手法として知られている算術符号化を半構造データの検索に応用した,逆算術符号化が提案されている.これは,木構造データ上のパスの依存関係を,データを圧縮したまま復号化することなく検査できる手法であり,この関係性を利用することで,パスによる問い合わせを高速に処理できる.しかしながら,この問い合わせで利用可能なパスの形式は限定されているため,一般のXPathの問い合わせは処理が困難である.そこで本研究では,このような逆算術符号化にノード間の先祖子孫関係を判定可能な範囲ラベルを導入することにより,より複雑な問い合わせ処理を高速に実現するための手法を提案する.評価実験の結果,300MB程度のXMLデータに対してテキストを直接処理する既存の手法と比較し,数十から百倍の高速化を達成した.また,本研究では,畳み込みカーネルのアイディアに基づいた,ラベル付き順序木に対するこれまでにない新しいカーネル関数を提案した.まず,畳み込みカーネルの枠組みにおいてラベル付き順序木に対して任意の部分グラフを部分構造として用いた場合の,効率の良いカーネル計算のアルゴリズムを提案し,曖昧なラベルや構造を取り込むような拡張を行った.さらに,より一般的な木構造として,順序のないラベル付き根付き木に対するカーネルを考えた場合には,カーネルの計算が#P-完全問題であることを示した.

報告書

(2件)
  • 2005 実績報告書
  • 2004 実績報告書
  • 研究成果

    (10件)

すべて 2006 2005 2004

すべて 雑誌論文 (10件)

  • [雑誌論文] 木構造データに対するカーネル関数の設計と解析2006

    • 著者名/発表者名
      鹿島 久嗣, 坂本 比呂志, 小柳 光生
    • 雑誌名

      人工知能学会論文誌 Vol.21, No.1

      ページ: 113-121

    • NAID

      10022006027

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 算術符号化を利用したXMLデータへの高速な問い合わせ処理の改良2006

    • 著者名/発表者名
      舞田哲哉, 坂本比呂志
    • 雑誌名

      電子情報通信学会第17回データ工学ワークショップ

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] A Fully Linear-Time Approximation Algorithm for Grammar-Based Compression2005

    • 著者名/発表者名
      Hiroshi Sakamoto
    • 雑誌名

      Journal of Discrete of Algorithm vol.3

      ページ: 416-430

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] A Simple Extension of Queriable Compression for XML Data2005

    • 著者名/発表者名
      Tetsuya Maita, Hiroshi Sakamoto
    • 雑誌名

      Proc.of the 2005 International Conference on Active Media Technology

      ページ: 91-95

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] データストリームのためのマイニング技術2005

    • 著者名/発表者名
      有村博紀, 喜田拓也
    • 雑誌名

      情報処理, 情報処理学会 46・1

      ページ: 4-11

    • NAID

      110002768327

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 大規模データストリームのためのマイニング技術の動向2005

    • 著者名/発表者名
      有村博紀
    • 雑誌名

      電子情報通信学会論文誌 J88-D-I・2(印刷中)

    • NAID

      110003207353

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Efficient Substructure Discovery from Large Semi-structured Data2004

    • 著者名/発表者名
      H.Arimura, H.Sakamoto他4名
    • 雑誌名

      IEICE Transactions on Information and Systems E87-D・12

      ページ: 2754-2763

    • NAID

      110003213885

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] WWWからの情報抽出-ウェブラッパーの自動構築-2004

    • 著者名/発表者名
      有村博紀, 坂本比呂志他2名
    • 雑誌名

      人工知能学会誌 19・3

      ページ: 302-310

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] An Efficient Algorithm for Enumerating Closed Patterns in Transaction Databases2004

    • 著者名/発表者名
      H.Arimura他3名
    • 雑誌名

      Proc.the 7th International Conference on Discovery Science (DS'04) LNAI3245

      ページ: 16-30

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] A Space-Saving Linear-Time Algorithm for Grammar-Based Compression2004

    • 著者名/発表者名
      H.Sakamoto他2名
    • 雑誌名

      Proc.11^<th> International Symposium on String Processing and Information Retrieval (SPIRE 2004) LNCS

    • NAID

      110003178856

    • 関連する報告書
      2004 実績報告書

URL: 

公開日: 2004-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi