• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

大規模半構造データからの高速知識発見システムの開発

研究課題

研究課題/領域番号 17200011
研究機関株式会社富士通研究所

研究代表者

岡本 青史  株式会社富士通研究所, ナレッジ研究センター, 主任研究員 (90399717)

研究分担者 竹田 正幸  九州大学, 大学院・システム情報科学研究院, 教授 (50216909)
篠原 歩  東北大学, 大学院・情報科学研究科, 教授 (00226151)
喜田 拓也  北海道大学, 大学院・情報科学研究科, 助教授 (70343316)
坂本 比呂志  九州工業大学, 情報工学部, 助教授 (50315123)
平田 耕一  九州工業大学, 情報工学部, 助教授 (20274558)
キーワード半構造データ / XML / 知識発見 / パターン発見 / パターン照合 / データ圧縮
研究概要

【半構造データ処理基盤技術】
パストライを用いた軽量なXMLストリーム処理高速化技法を開発した.XAXENと名づけたこの処理系は数千〜数万のクエリを同時に処理することが可能で,ストリーム処理手法として有名なXMLTK, YFilterと比較して実行速度で約4〜6倍,メモリ使用量で約6倍以上の圧倒的な性能を達成した.
また,XQL等の質問言語における経路質問を処理するための基本問題であるグラフ構造上の到達可能性問題に対し,高速で規模耐性の高い索引構造を提案・実装し,その有効性を示した(DEWS2007優秀論文賞受賞).
さらに,半構造データにおける自然言語テキストや形態素解析後のテキスト,注釈付きテキスト,構造データ列に対する効率よい索引構造の研究を行い,任意の正整数kに対してk単語接尾辞木を構築する線形時間オンライン構築アルゴリズムを与えると同時に,これまで未解決だったプロパティ付き接尾辞木の線形時間構築問題に対して0(n)時間構築アルゴリズムを与えることでこの問題を肯定的に解決した.
【半構造データからのパターン発見技術】
最適パターン発見問題に対し,新たなパターン族を導入することで効率的なパターン発見アルゴリズムを開発すると同時にWebスパム検出問題への適用研究を行った.
また,木構造からのパターン発見問題に対し,出現パターンを学習するためのカーネル関数の設計と実験による解析を行うと同時に,一般的な木構造を学習する困難性が#P-完全であることを示した(2006年度人工知能学会論文賞受賞).
さらに,木に埋め込まれたパスの頻度に基づく木の類似性とその計算アルゴリズムの研究を行い,葉が高々2で頂点数がqであるqグラムを共通部分とみなした木の頻度最大化に基づく類似性に着目することで,高速な頻度計算アルゴリズムを開発し,糖鎖データの学習やクラスタリングへの応用によりその有効性を示した.

  • 研究成果

    (33件)

すべて 2007 2006

すべて 雑誌論文 (32件) (うち査読あり 13件) 図書 (1件)

  • [雑誌論文] プロパティ付き接尾辞木の構築における境界発見アルゴリズム2007

    • 著者名/発表者名
      上村 卓史, 他2名
    • 雑誌名

      第18回データ工学ワークショップ(DEWS2007)

      ページ: A2-7

    • 説明
      「研究成果報告書概要(和文)」より
    • 査読あり
  • [雑誌論文] 連続データストリームに対するビット並列手法を用いた高度な時系列パターン照合2007

    • 著者名/発表者名
      斉藤 智哉, 他2名
    • 雑誌名

      第18回データ工学ワークショップ(DEWS2007)

      ページ: C1-9

    • 説明
      「研究成果報告書概要(和文)」より
    • 査読あり
  • [雑誌論文] XML文書フィルタリングのための軽量な高速化技法2007

    • 著者名/発表者名
      御手洗 秀一, 他2名
    • 雑誌名

      第18回データ工学ワークショップ(DEWS2007)

      ページ: L5-4

    • 説明
      「研究成果報告書概要(和文)」より
    • 査読あり
  • [雑誌論文] 参照構造を持つXML上の高速な到達可能性判定2007

    • 著者名/発表者名
      中村有作, 他2名
    • 雑誌名

      人工知能学論文誌 22(2)

      ページ: 191-199

    • 説明
      「研究成果報告書概要(和文)」より
    • 査読あり
  • [雑誌論文] Simple Linear-Time off-Line Text Compression.by Longest-First Substitution2007

    • 著者名/発表者名
      Ryosuke Nakamura, 他3名
    • 雑誌名

      Proc.Data Compression Conference 2007

      ページ: 123-132

  • [雑誌論文] Efficient Computation of Substring Equivalence Classes with Suffix Arrays2007

    • 著者名/発表者名
      Kazuyuki Narisawa, 他3名
    • 雑誌名

      Proc.18^<th> Annual Symposium on Combinatorial Pattern Matching (to appear)

  • [雑誌論文] Light-weight acceleration for streaming XML document filtering2007

    • 著者名/発表者名
      Shuichi Mitarai, 他2名
    • 雑誌名

      Proc.3^<rd> IEEE International Workshop on Databases for Next-Generation Researchers (to appear)

  • [雑誌論文] An Efficient Algorithm for Complex Pattern Matching over Continuous Data Streams Based on Bit-Parallel Method2007

    • 著者名/発表者名
      Tomoya Saito, 他2名
    • 雑誌名

      Proc.3^<rd> IEEE International Workshop on Databases for Next-Generation Researchers (to appear)

  • [雑誌論文] Efficient Reachability Test on Directed Graphs and Its Application to Large XML Data2007

    • 著者名/発表者名
      Yuusaku Nakamura, 他2名
    • 雑誌名

      Proc.3^<rd> IEEE International Workshop on Databases for Next-Generation Researchers (to appear)

  • [雑誌論文] A Spectrum Tree Kernel2007

    • 著者名/発表者名
      Tetsuji Kuboyama, 他4名
    • 雑誌名

      人工知能学会誌 22

      ページ: 140-147

  • [雑誌論文] 有向グラフ上の到達可能性判定のための索引構造と大規模XMLデー一タヘの応用2007

    • 著者名/発表者名
      中村有作, 他2名
    • 雑誌名

      第18回データ工学ワークショップ(DEWS2007)【DEWS2007優秀論文賞受賞】

      ページ: L5-3

  • [雑誌論文] Reachability on Suffix Tree Graphs2006

    • 著者名/発表者名
      Yasuto Higa, 他3名
    • 雑誌名

      In Proc.Prague Stringology Conference 2006

      ページ: 212-225

    • 説明
      「研究成果報告書概要(和文)」より
    • 査読あり
  • [雑誌論文] Sparse Compact Directed Acyclic Word Graphs2006

    • 著者名/発表者名
      Shunsuke Inenaga, 他1名
    • 雑誌名

      In Proc.Prague Stringology Conference 2006

      ページ: 195-211

    • 説明
      「研究成果報告書概要(和文)」より
    • 査読あり
  • [雑誌論文] On-line Linear-time Construction of Word Suffix Trees2006

    • 著者名/発表者名
      Shunsuke Inenaga, 他1名
    • 雑誌名

      Lecture Note in Computer Science(In Proc.17^<th> Annual Symposium on Combinatorial Pattern Matching) 4009

      ページ: 60-71

    • 説明
      「研究成果報告書概要(和文)」より
    • 査読あり
  • [雑誌論文] Online Construction of Truncated Suffix Tree with Word Count Limitation2006

    • 著者名/発表者名
      Takuya Kida, 他2名
    • 雑誌名

      Proc.International Workshop on Data-Mining and Statistical Science

    • 説明
      「研究成果報告書概要(和文)」より
    • 査読あり
  • [雑誌論文] Improving Time and Space Complexity for Compressed Pattern Matching2006

    • 著者名/発表者名
      Shirou Maruyama, 他2名
    • 雑誌名

      Proc.17^<th> International Symposium on Algorithms and Computation

      ページ: 484-493

    • 説明
      「研究成果報告書概要(和文)」より
    • 査読あり
  • [雑誌論文] A Gram Distribution Kernel Applied to Glycan Classification and Motif Extraction2006

    • 著者名/発表者名
      Tetsuji Kuboyama, 他4名
    • 雑誌名

      Proc.17^<th> International Conference on Genome Informatics

      ページ: 25-34

    • 説明
      「研究成果報告書概要(和文)」より
    • 査読あり
  • [雑誌論文] Extraction of Frequent Causal Episodes from Bacterial Culture Data2006

    • 著者名/発表者名
      Takashi Katoh, 他2名
    • 雑誌名

      Proc.4^<th> Workshop on Learining with Logics and Logics for Learning

      ページ: 53-60

    • 説明
      「研究成果報告書概要(和文)」より
    • 査読あり
  • [雑誌論文] A q-Gram Based Distance Measure for Ordered Labeled Trees2006

    • 著者名/発表者名
      Tetsuji Kuboyama, 他3名
    • 雑誌名

      Proc.4^<th> Workshop on Learining with Logics and Logics for Learning

      ページ: 77-83

    • 説明
      「研究成果報告書概要(和文)」より
    • 査読あり
  • [雑誌論文] パスプルーニングと決定性有限オートマトンを用いたストリーム指向のXQuery処理2006

    • 著者名/発表者名
      石野 明, 他1名
    • 雑誌名

      日本データベース学会Letters 4(4)

      ページ: 17-20

    • 説明
      「研究成果報告書概要(和文)」より
    • 査読あり
  • [雑誌論文] A New Family of String Classifiers based on Local Relatedness2006

    • 著者名/発表者名
      Yasuto Higa, 他3名
    • 雑誌名

      Lectnre Notes in Artificial Intelligence(Proc.9^<th> International Conference on Discovery Science) 4265

      ページ: 114-124

  • [雑誌論文] Sparse Directed Acyclic Word Graphs2006

    • 著者名/発表者名
      Shunsuke Inenaga, 他1名
    • 雑誌名

      Lecture Notes in Computer Science (Proc.13^<th> International Symposium on String Processing and Information Retrieval) 4209

      ページ: 61-73

  • [雑誌論文] Subsumption Algorithm for Chordal Clauses2006

    • 著者名/発表者名
      Megumi Kuwabara, 他2名
    • 雑誌名

      Proc.4^<th> Workshop on Learining with Logics and Logics for Learning

      ページ: 23-30

  • [雑誌論文] Fast Reachability Test on DAGs for XML (in Japanese)2006

    • 著者名/発表者名
      Yuusaku Nakamura, 他2名
    • 雑誌名

      Proc.International Workshop on Data-Mining and Statistical Science 2006

      ページ: 151-158

  • [雑誌論文] Mining Sectorial Episodes from Event Sequences2006

    • 著者名/発表者名
      Tetsuji Kuboyama, 他2名
    • 雑誌名

      Lecture Notes in Artificial Intelligence(Proc.9th International Conference on Discovery Science) 4265

      ページ: 137-148

  • [雑誌論文] Development of a Multi-Agent Based Generic Traffic Simulator2006

    • 著者名/発表者名
      Kosuke Ono, 他4名
    • 雑誌名

      Lecture Notes in Artificial Intelligence (New Frontiers in Artificial Intelligence) 4012

      ページ: 249-260

  • [雑誌論文] On Generalization and Subsumption for Ordered Clauses2006

    • 著者名/発表者名
      Megumi Kuwabara, 他3名
    • 雑誌名

      Lecture Notes in Artificial Intelligence (New Frontiers in Artificial Intelligence) 4012

      ページ: 212-223

  • [雑誌論文] Prediction of Real-Valued Functions from Finite Examples2006

    • 著者名/発表者名
      Eiju Hirowatari, 他1名
    • 雑誌名

      Lecture Notes in Artificial Intelligence (New Frontiers in Artificial Intelligence) 4012

      ページ: 224-234

  • [雑誌論文] The Gram Distribution for Rooted Ordered Trees2006

    • 著者名/発表者名
      Nobuhito Ohkubo, 他4名
    • 雑誌名

      Proc.4^<th> Workshop on Learining with Logics and Logics for Learning

      ページ: 69-76

  • [雑誌論文] 医薬品の取り違えミスを防止するための薬名類似度の定量的指標の構築2006

    • 著者名/発表者名
      大谷壽一, 他3名
    • 雑誌名

      薬学雑誌 126(5)

      ページ: 349-356

  • [雑誌論文] 単語幅を制約した接尾辞木の効率のよい構築アルゴリズム2006

    • 著者名/発表者名
      上村 卓史, 他2名
    • 雑誌名

      FIT情報科学技術レターズ

  • [雑誌論文] 木構造データに対するカーネル関数の設計と解析2006

    • 著者名/発表者名
      鹿島 久嗣, 他2名
    • 雑誌名

      人工知能学会論文誌 【2006年度人工知能学会論文賞受賞】 21(1)

      ページ: 113-121

  • [図書] Complex Medical Engineering(Attribute Selection Measures with Possibility and Their Application to Classifying MRSA from MSSA)2007

    • 著者名/発表者名
      J.L.Wu, 他4名 eds.(Kouichi Hirata, 他5名)
    • 総ページ数
      631
    • 出版者
      Springer-Verlag
    • 説明
      「研究成果報告書概要(和文)」より

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi