• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2004 年度 実績報告書

超高速データストリームのためのオンライン型半構造情報変換システムの開発

研究課題

研究課題/領域番号 16650021
研究機関北海道大学

研究代表者

有村 博紀  北海道大学, 大学院・情報科学研究科, 教授 (20222763)

研究分担者 坂本 比呂志  九州工業大学, 情報工学部, 助教授 (50315123)
キーワードXML / 半構造データ / XPath / 情報検索 / ストリーム / 文法圧縮 / 圧縮索引 / SAX
研究概要

平成16年度は,次のように研究を行った.
1.半構造データストリーム変換の定式化:インターネットにおける現在の半構造データストリームの利用形態を分析し,オンライン型半構造情報変換システムに必要な半構造データ処理機能を洗い出し,Xquey pathパターンの部分族であるXmatch言語を設計した(有村・坂本).また,半構造データに対する圧縮法や索引に必要な機能の洗い出しもおこなった(坂本).
2.ストリーム指向半構造パターン変換技術の開発:このXmatch言語を対象に,テキストの一方向逐次走査に基づくパターン照合技法に基づいたXmatchシステムを開発した.これにより,データストリームを左から右へ一方向逐次走査しながら,与えられたXPathパターンの出現を検出し,変換テンプレートを用いたオンライン再構成を行なう高速な軽量パターン変換を実現した.また,このために,ASAX (Alternative SAX)と呼ぶ,新しいXMLテキスト走査技術を開発した.結果として,実際の大規模XMLデータをもちいた従来の主記憶にデータ木を展開するタイプのXpath処理系に対して10数倍以上の高速化と著しい記憶効率の改善を得た.さらに,ASAX技術の導入により,同種のストリーム指向Xpathパターン照合システム(XSQ)に対しても2倍から4倍程度の高速化を達成した.本技術はその独自性と有効性を高く評価され,本グループによる和文発表の第一著者が情報処理学会山下記念研究賞をH16年11月に受賞した(有村).
3.最適化技術を用いた高効率圧縮アルゴリズムの開発:最適圧縮率に対して,理論的に性能評価をもつ線形時間文法圧縮アルゴリズムを開発した.この種の圧縮アルゴリズムは,Sequiturアルゴリズム等,半構造データからの情報抽出や圧縮と密接な関係をもつ.また,半構造データに対する検索可能な圧縮索引についても成果を得た(坂本).

  • 研究成果

    (6件)

すべて 2005 2004

すべて 雑誌論文 (6件)

  • [雑誌論文] データストリームのためのマイニング技術2005

    • 著者名/発表者名
      有村博紀, 喜田拓也
    • 雑誌名

      情報処理, 情報処理学会 46・1

      ページ: 4-11

  • [雑誌論文] 大規模データストリームのためのマイニング技術の動向2005

    • 著者名/発表者名
      有村博紀
    • 雑誌名

      電子情報通信学会論文誌 J88-D-I・2(印刷中)

  • [雑誌論文] Efficient Substructure Discovery from Large Semi-structured Data2004

    • 著者名/発表者名
      H.Arimura, H.Sakamoto他4名
    • 雑誌名

      IEICE Transactions on Information and Systems E87-D・12

      ページ: 2754-2763

  • [雑誌論文] WWWからの情報抽出-ウェブラッパーの自動構築-2004

    • 著者名/発表者名
      有村博紀, 坂本比呂志他2名
    • 雑誌名

      人工知能学会誌 19・3

      ページ: 302-310

  • [雑誌論文] An Efficient Algorithm for Enumerating Closed Patterns in Transaction Databases2004

    • 著者名/発表者名
      H.Arimura他3名
    • 雑誌名

      Proc.the 7th International Conference on Discovery Science (DS'04) LNAI3245

      ページ: 16-30

  • [雑誌論文] A Space-Saving Linear-Time Algorithm for Grammar-Based Compression2004

    • 著者名/発表者名
      H.Sakamoto他2名
    • 雑誌名

      Proc.11^<th> International Symposium on String Processing and Information Retrieval (SPIRE 2004) LNCS

URL: 

公開日: 2006-07-12   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi