• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2005 年度 実績報告書

超高速データストリームのためのオンライン型半構造情報変換システムの開発

研究課題

研究課題/領域番号 16650021
研究機関九州工業大学

研究代表者

坂本 比呂志  九州工業大学, 情報工学部, 助教授 (50315123)

キーワードデータストリーム / 半構造データ / オンラインアルゴリズム / 情報抽出 / パターン発見
研究概要

本研究では,半構造データに対する高速なXPath処理法を提案した.これまでに,データを効率的に圧縮する手法として知られている算術符号化を半構造データの検索に応用した,逆算術符号化が提案されている.これは,木構造データ上のパスの依存関係を,データを圧縮したまま復号化することなく検査できる手法であり,この関係性を利用することで,パスによる問い合わせを高速に処理できる.しかしながら,この問い合わせで利用可能なパスの形式は限定されているため,一般のXPathの問い合わせは処理が困難である.そこで本研究では,このような逆算術符号化にノード間の先祖子孫関係を判定可能な範囲ラベルを導入することにより,より複雑な問い合わせ処理を高速に実現するための手法を提案する.評価実験の結果,300MB程度のXMLデータに対してテキストを直接処理する既存の手法と比較し,数十から百倍の高速化を達成した.また,本研究では,畳み込みカーネルのアイディアに基づいた,ラベル付き順序木に対するこれまでにない新しいカーネル関数を提案した.まず,畳み込みカーネルの枠組みにおいてラベル付き順序木に対して任意の部分グラフを部分構造として用いた場合の,効率の良いカーネル計算のアルゴリズムを提案し,曖昧なラベルや構造を取り込むような拡張を行った.さらに,より一般的な木構造として,順序のないラベル付き根付き木に対するカーネルを考えた場合には,カーネルの計算が#P-完全問題であることを示した.

  • 研究成果

    (4件)

すべて 2006 2005

すべて 雑誌論文 (4件)

  • [雑誌論文] 木構造データに対するカーネル関数の設計と解析2006

    • 著者名/発表者名
      鹿島 久嗣, 坂本 比呂志, 小柳 光生
    • 雑誌名

      人工知能学会論文誌 Vol.21, No.1

      ページ: 113-121

  • [雑誌論文] 算術符号化を利用したXMLデータへの高速な問い合わせ処理の改良2006

    • 著者名/発表者名
      舞田哲哉, 坂本比呂志
    • 雑誌名

      電子情報通信学会第17回データ工学ワークショップ

      ページ: 7B-o4

  • [雑誌論文] A Fully Linear-Time Approximation Algorithm for Grammar-Based Compression2005

    • 著者名/発表者名
      Hiroshi Sakamoto
    • 雑誌名

      Journal of Discrete of Algorithm vol.3

      ページ: 416-430

  • [雑誌論文] A Simple Extension of Queriable Compression for XML Data2005

    • 著者名/発表者名
      Tetsuya Maita, Hiroshi Sakamoto
    • 雑誌名

      Proc.of the 2005 International Conference on Active Media Technology

      ページ: 91-95

URL: 

公開日: 2007-04-02   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi