• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2006 Fiscal Year Annual Research Report

大規模半構造データからの高速知識発見システムの開発

Research Project

Project/Area Number 17200011
Research InstitutionFUJITSU LABORATORIES LTD.

Principal Investigator

岡本 青史  株式会社富士通研究所, ナレッジ研究センター, 主任研究員 (90399717)

Co-Investigator(Kenkyū-buntansha) 竹田 正幸  九州大学, 大学院・システム情報科学研究院, 教授 (50216909)
篠原 歩  東北大学, 大学院・情報科学研究科, 教授 (00226151)
喜田 拓也  北海道大学, 大学院・情報科学研究科, 助教授 (70343316)
坂本 比呂志  九州工業大学, 情報工学部, 助教授 (50315123)
平田 耕一  九州工業大学, 情報工学部, 助教授 (20274558)
Keywords半構造データ / XML / 知識発見 / パターン発見 / パターン照合 / データ圧縮
Research Abstract

【半構造データ処理基盤技術】
パストライを用いた軽量なXMLストリーム処理高速化技法を開発した.XAXENと名づけたこの処理系は数千〜数万のクエリを同時に処理することが可能で,ストリーム処理手法として有名なXMLTK, YFilterと比較して実行速度で約4〜6倍,メモリ使用量で約6倍以上の圧倒的な性能を達成した.
また,XQL等の質問言語における経路質問を処理するための基本問題であるグラフ構造上の到達可能性問題に対し,高速で規模耐性の高い索引構造を提案・実装し,その有効性を示した(DEWS2007優秀論文賞受賞).
さらに,半構造データにおける自然言語テキストや形態素解析後のテキスト,注釈付きテキスト,構造データ列に対する効率よい索引構造の研究を行い,任意の正整数kに対してk単語接尾辞木を構築する線形時間オンライン構築アルゴリズムを与えると同時に,これまで未解決だったプロパティ付き接尾辞木の線形時間構築問題に対して0(n)時間構築アルゴリズムを与えることでこの問題を肯定的に解決した.
【半構造データからのパターン発見技術】
最適パターン発見問題に対し,新たなパターン族を導入することで効率的なパターン発見アルゴリズムを開発すると同時にWebスパム検出問題への適用研究を行った.
また,木構造からのパターン発見問題に対し,出現パターンを学習するためのカーネル関数の設計と実験による解析を行うと同時に,一般的な木構造を学習する困難性が#P-完全であることを示した(2006年度人工知能学会論文賞受賞).
さらに,木に埋め込まれたパスの頻度に基づく木の類似性とその計算アルゴリズムの研究を行い,葉が高々2で頂点数がqであるqグラムを共通部分とみなした木の頻度最大化に基づく類似性に着目することで,高速な頻度計算アルゴリズムを開発し,糖鎖データの学習やクラスタリングへの応用によりその有効性を示した.

  • Research Products

    (33 results)

All 2007 2006

All Journal Article (32 results) (of which Peer Reviewed: 13 results) Book (1 results)

  • [Journal Article] プロパティ付き接尾辞木の構築における境界発見アルゴリズム2007

    • Author(s)
      上村 卓史, 他2名
    • Journal Title

      第18回データ工学ワークショップ(DEWS2007)

      Pages: A2-7

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] 連続データストリームに対するビット並列手法を用いた高度な時系列パターン照合2007

    • Author(s)
      斉藤 智哉, 他2名
    • Journal Title

      第18回データ工学ワークショップ(DEWS2007)

      Pages: C1-9

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] XML文書フィルタリングのための軽量な高速化技法2007

    • Author(s)
      御手洗 秀一, 他2名
    • Journal Title

      第18回データ工学ワークショップ(DEWS2007)

      Pages: L5-4

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] 参照構造を持つXML上の高速な到達可能性判定2007

    • Author(s)
      中村有作, 他2名
    • Journal Title

      人工知能学論文誌 22(2)

      Pages: 191-199

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] Simple Linear-Time off-Line Text Compression.by Longest-First Substitution2007

    • Author(s)
      Ryosuke Nakamura, 他3名
    • Journal Title

      Proc.Data Compression Conference 2007

      Pages: 123-132

  • [Journal Article] Efficient Computation of Substring Equivalence Classes with Suffix Arrays2007

    • Author(s)
      Kazuyuki Narisawa, 他3名
    • Journal Title

      Proc.18^<th> Annual Symposium on Combinatorial Pattern Matching (to appear)

  • [Journal Article] Light-weight acceleration for streaming XML document filtering2007

    • Author(s)
      Shuichi Mitarai, 他2名
    • Journal Title

      Proc.3^<rd> IEEE International Workshop on Databases for Next-Generation Researchers (to appear)

  • [Journal Article] An Efficient Algorithm for Complex Pattern Matching over Continuous Data Streams Based on Bit-Parallel Method2007

    • Author(s)
      Tomoya Saito, 他2名
    • Journal Title

      Proc.3^<rd> IEEE International Workshop on Databases for Next-Generation Researchers (to appear)

  • [Journal Article] Efficient Reachability Test on Directed Graphs and Its Application to Large XML Data2007

    • Author(s)
      Yuusaku Nakamura, 他2名
    • Journal Title

      Proc.3^<rd> IEEE International Workshop on Databases for Next-Generation Researchers (to appear)

  • [Journal Article] A Spectrum Tree Kernel2007

    • Author(s)
      Tetsuji Kuboyama, 他4名
    • Journal Title

      人工知能学会誌 22

      Pages: 140-147

  • [Journal Article] 有向グラフ上の到達可能性判定のための索引構造と大規模XMLデー一タヘの応用2007

    • Author(s)
      中村有作, 他2名
    • Journal Title

      第18回データ工学ワークショップ(DEWS2007)【DEWS2007優秀論文賞受賞】

      Pages: L5-3

  • [Journal Article] Reachability on Suffix Tree Graphs2006

    • Author(s)
      Yasuto Higa, 他3名
    • Journal Title

      In Proc.Prague Stringology Conference 2006

      Pages: 212-225

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] Sparse Compact Directed Acyclic Word Graphs2006

    • Author(s)
      Shunsuke Inenaga, 他1名
    • Journal Title

      In Proc.Prague Stringology Conference 2006

      Pages: 195-211

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] On-line Linear-time Construction of Word Suffix Trees2006

    • Author(s)
      Shunsuke Inenaga, 他1名
    • Journal Title

      Lecture Note in Computer Science(In Proc.17^<th> Annual Symposium on Combinatorial Pattern Matching) 4009

      Pages: 60-71

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] Online Construction of Truncated Suffix Tree with Word Count Limitation2006

    • Author(s)
      Takuya Kida, 他2名
    • Journal Title

      Proc.International Workshop on Data-Mining and Statistical Science

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] Improving Time and Space Complexity for Compressed Pattern Matching2006

    • Author(s)
      Shirou Maruyama, 他2名
    • Journal Title

      Proc.17^<th> International Symposium on Algorithms and Computation

      Pages: 484-493

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] A Gram Distribution Kernel Applied to Glycan Classification and Motif Extraction2006

    • Author(s)
      Tetsuji Kuboyama, 他4名
    • Journal Title

      Proc.17^<th> International Conference on Genome Informatics

      Pages: 25-34

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] Extraction of Frequent Causal Episodes from Bacterial Culture Data2006

    • Author(s)
      Takashi Katoh, 他2名
    • Journal Title

      Proc.4^<th> Workshop on Learining with Logics and Logics for Learning

      Pages: 53-60

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] A q-Gram Based Distance Measure for Ordered Labeled Trees2006

    • Author(s)
      Tetsuji Kuboyama, 他3名
    • Journal Title

      Proc.4^<th> Workshop on Learining with Logics and Logics for Learning

      Pages: 77-83

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] パスプルーニングと決定性有限オートマトンを用いたストリーム指向のXQuery処理2006

    • Author(s)
      石野 明, 他1名
    • Journal Title

      日本データベース学会Letters 4(4)

      Pages: 17-20

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] A New Family of String Classifiers based on Local Relatedness2006

    • Author(s)
      Yasuto Higa, 他3名
    • Journal Title

      Lectnre Notes in Artificial Intelligence(Proc.9^<th> International Conference on Discovery Science) 4265

      Pages: 114-124

  • [Journal Article] Sparse Directed Acyclic Word Graphs2006

    • Author(s)
      Shunsuke Inenaga, 他1名
    • Journal Title

      Lecture Notes in Computer Science (Proc.13^<th> International Symposium on String Processing and Information Retrieval) 4209

      Pages: 61-73

  • [Journal Article] Subsumption Algorithm for Chordal Clauses2006

    • Author(s)
      Megumi Kuwabara, 他2名
    • Journal Title

      Proc.4^<th> Workshop on Learining with Logics and Logics for Learning

      Pages: 23-30

  • [Journal Article] Fast Reachability Test on DAGs for XML (in Japanese)2006

    • Author(s)
      Yuusaku Nakamura, 他2名
    • Journal Title

      Proc.International Workshop on Data-Mining and Statistical Science 2006

      Pages: 151-158

  • [Journal Article] Mining Sectorial Episodes from Event Sequences2006

    • Author(s)
      Tetsuji Kuboyama, 他2名
    • Journal Title

      Lecture Notes in Artificial Intelligence(Proc.9th International Conference on Discovery Science) 4265

      Pages: 137-148

  • [Journal Article] Development of a Multi-Agent Based Generic Traffic Simulator2006

    • Author(s)
      Kosuke Ono, 他4名
    • Journal Title

      Lecture Notes in Artificial Intelligence (New Frontiers in Artificial Intelligence) 4012

      Pages: 249-260

  • [Journal Article] On Generalization and Subsumption for Ordered Clauses2006

    • Author(s)
      Megumi Kuwabara, 他3名
    • Journal Title

      Lecture Notes in Artificial Intelligence (New Frontiers in Artificial Intelligence) 4012

      Pages: 212-223

  • [Journal Article] Prediction of Real-Valued Functions from Finite Examples2006

    • Author(s)
      Eiju Hirowatari, 他1名
    • Journal Title

      Lecture Notes in Artificial Intelligence (New Frontiers in Artificial Intelligence) 4012

      Pages: 224-234

  • [Journal Article] The Gram Distribution for Rooted Ordered Trees2006

    • Author(s)
      Nobuhito Ohkubo, 他4名
    • Journal Title

      Proc.4^<th> Workshop on Learining with Logics and Logics for Learning

      Pages: 69-76

  • [Journal Article] 医薬品の取り違えミスを防止するための薬名類似度の定量的指標の構築2006

    • Author(s)
      大谷壽一, 他3名
    • Journal Title

      薬学雑誌 126(5)

      Pages: 349-356

  • [Journal Article] 単語幅を制約した接尾辞木の効率のよい構築アルゴリズム2006

    • Author(s)
      上村 卓史, 他2名
    • Journal Title

      FIT情報科学技術レターズ

  • [Journal Article] 木構造データに対するカーネル関数の設計と解析2006

    • Author(s)
      鹿島 久嗣, 他2名
    • Journal Title

      人工知能学会論文誌 【2006年度人工知能学会論文賞受賞】 21(1)

      Pages: 113-121

  • [Book] Complex Medical Engineering(Attribute Selection Measures with Possibility and Their Application to Classifying MRSA from MSSA)2007

    • Author(s)
      J.L.Wu, 他4名 eds.(Kouichi Hirata, 他5名)
    • Total Pages
      631
    • Publisher
      Springer-Verlag
    • Description
      「研究成果報告書概要(和文)」より

URL: 

Published: 2008-05-08   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi