• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

超高速データストリームのためのオンライン型半構造情報変換システムの開発

Research Project

Project/Area Number 16650021
Research Category

Grant-in-Aid for Exploratory Research

Allocation TypeSingle-year Grants
Research Field Media informatics/Database
Research InstitutionKyushu Institute of Technology (2005)
Hokkaido University (2004)

Principal Investigator

坂本 比呂志 (2005)  九州工業大学, 情報工学部, 助教授 (50315123)

有村 博紀 (2004)  北海道大学, 大学院・情報科学研究科, 教授 (20222763)

Co-Investigator(Kenkyū-buntansha) 坂本 比呂志  九州工業大学, 情報工学部, 助教授 (50315123)
Project Period (FY) 2004 – 2005
Project Status Completed (Fiscal Year 2005)
Budget Amount *help
¥2,500,000 (Direct Cost: ¥2,500,000)
Fiscal Year 2005: ¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 2004: ¥1,600,000 (Direct Cost: ¥1,600,000)
Keywordsデータストリーム / 半構造データ / オンラインアルゴリズム / 情報抽出 / パターン発見 / XML / XPath / 情報検索 / ストリーム / 文法圧縮 / 圧縮索引 / SAX
Research Abstract

本研究では,半構造データに対する高速なXPath処理法を提案した.これまでに,データを効率的に圧縮する手法として知られている算術符号化を半構造データの検索に応用した,逆算術符号化が提案されている.これは,木構造データ上のパスの依存関係を,データを圧縮したまま復号化することなく検査できる手法であり,この関係性を利用することで,パスによる問い合わせを高速に処理できる.しかしながら,この問い合わせで利用可能なパスの形式は限定されているため,一般のXPathの問い合わせは処理が困難である.そこで本研究では,このような逆算術符号化にノード間の先祖子孫関係を判定可能な範囲ラベルを導入することにより,より複雑な問い合わせ処理を高速に実現するための手法を提案する.評価実験の結果,300MB程度のXMLデータに対してテキストを直接処理する既存の手法と比較し,数十から百倍の高速化を達成した.また,本研究では,畳み込みカーネルのアイディアに基づいた,ラベル付き順序木に対するこれまでにない新しいカーネル関数を提案した.まず,畳み込みカーネルの枠組みにおいてラベル付き順序木に対して任意の部分グラフを部分構造として用いた場合の,効率の良いカーネル計算のアルゴリズムを提案し,曖昧なラベルや構造を取り込むような拡張を行った.さらに,より一般的な木構造として,順序のないラベル付き根付き木に対するカーネルを考えた場合には,カーネルの計算が#P-完全問題であることを示した.

Report

(2 results)
  • 2005 Annual Research Report
  • 2004 Annual Research Report
  • Research Products

    (10 results)

All 2006 2005 2004

All Journal Article (10 results)

  • [Journal Article] 木構造データに対するカーネル関数の設計と解析2006

    • Author(s)
      鹿島 久嗣, 坂本 比呂志, 小柳 光生
    • Journal Title

      人工知能学会論文誌 Vol.21, No.1

      Pages: 113-121

    • NAID

      10022006027

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 算術符号化を利用したXMLデータへの高速な問い合わせ処理の改良2006

    • Author(s)
      舞田哲哉, 坂本比呂志
    • Journal Title

      電子情報通信学会第17回データ工学ワークショップ

    • Related Report
      2005 Annual Research Report
  • [Journal Article] A Fully Linear-Time Approximation Algorithm for Grammar-Based Compression2005

    • Author(s)
      Hiroshi Sakamoto
    • Journal Title

      Journal of Discrete of Algorithm vol.3

      Pages: 416-430

    • Related Report
      2005 Annual Research Report
  • [Journal Article] A Simple Extension of Queriable Compression for XML Data2005

    • Author(s)
      Tetsuya Maita, Hiroshi Sakamoto
    • Journal Title

      Proc.of the 2005 International Conference on Active Media Technology

      Pages: 91-95

    • Related Report
      2005 Annual Research Report
  • [Journal Article] データストリームのためのマイニング技術2005

    • Author(s)
      有村博紀, 喜田拓也
    • Journal Title

      情報処理, 情報処理学会 46・1

      Pages: 4-11

    • NAID

      110002768327

    • Related Report
      2004 Annual Research Report
  • [Journal Article] 大規模データストリームのためのマイニング技術の動向2005

    • Author(s)
      有村博紀
    • Journal Title

      電子情報通信学会論文誌 J88-D-I・2(印刷中)

    • NAID

      110003207353

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Efficient Substructure Discovery from Large Semi-structured Data2004

    • Author(s)
      H.Arimura, H.Sakamoto他4名
    • Journal Title

      IEICE Transactions on Information and Systems E87-D・12

      Pages: 2754-2763

    • NAID

      110003213885

    • Related Report
      2004 Annual Research Report
  • [Journal Article] WWWからの情報抽出-ウェブラッパーの自動構築-2004

    • Author(s)
      有村博紀, 坂本比呂志他2名
    • Journal Title

      人工知能学会誌 19・3

      Pages: 302-310

    • Related Report
      2004 Annual Research Report
  • [Journal Article] An Efficient Algorithm for Enumerating Closed Patterns in Transaction Databases2004

    • Author(s)
      H.Arimura他3名
    • Journal Title

      Proc.the 7th International Conference on Discovery Science (DS'04) LNAI3245

      Pages: 16-30

    • Related Report
      2004 Annual Research Report
  • [Journal Article] A Space-Saving Linear-Time Algorithm for Grammar-Based Compression2004

    • Author(s)
      H.Sakamoto他2名
    • Journal Title

      Proc.11^<th> International Symposium on String Processing and Information Retrieval (SPIRE 2004) LNCS

    • NAID

      110003178856

    • Related Report
      2004 Annual Research Report

URL: 

Published: 2004-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi