• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

大規模データストリームからの超高速データマイニングの研究

研究課題

研究課題/領域番号 15300036
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 メディア情報学・データベース
研究機関九州大学 (2003, 2005)
北海道大学 (2004)

研究代表者

池田 大輔 (2005)  九州大学, 附属図書館, 助教授 (00294992)

有村 博紀 (2003-2004)  北海道大学, 大学院・情報科学研究科, 教授 (20222763)

研究分担者 竹田 正幸  九州大学, 大学院・システム情報科学研究院, 教授 (50216909)
篠原 歩  東北大学, 大学院・情報科学研究科, 教授 (00226151)
喜田 拓也  北海道大学, 大学院・情報科学研究科, 助教授 (70343316)
笠原 義晃  九州大学, 情報基盤センター, 助手 (60284577)
石野 明  九州大学, 大学評価情報室, 助手 (10315129)
研究期間 (年度) 2003 – 2005
研究課題ステータス 完了 (2005年度)
配分額 *注記
15,600千円 (直接経費: 15,600千円)
2005年度: 2,700千円 (直接経費: 2,700千円)
2004年度: 5,700千円 (直接経費: 5,700千円)
2003年度: 7,200千円 (直接経費: 7,200千円)
キーワードデータストリーム / データマイニング / XMLデータ / 半構造データ / パターン照合 / 系列パターン / XPath / 木マイニング / 半構造データ技術 / 高速データストリーム / 情報抽出 / 知識獲得 / 大規模ネットワークデータ / オンライン半構造データ検索
研究概要

ネットワーク上を時間的に変化しながら流れる大量半構造データストリームから有用な情報を効率よく獲得する超高速オンライン型データマイニング・システムの研究開発を行った.最終年度である平成17年度は,前年度までに研究開発した基礎理論の深化と,ネットワークデータへの応用の両面から,ストリーム指向パターン照合と半構造データマイニング,さらに,応用としてネットワーク不正侵入検出などの問題について,以下のように研究開発を行った.また,3年間の研究成果の発表・出版を行った.
(1)半構造データストリームマイニングの調査と定式化:ネットワーク侵入検出やデータストリームマイニング等の実際のデータストリーム応用を解析し(池田・笠原・喜田),ストリームマイニングに関する最新の技術動向の調査を行った.また,昨年度までの調査結果を出版した(喜田・有村).
(2)ストリーム指向半構造パターン照合技術の開発:データストリームを左から右へ一方向逐次走査に基づいた新しいストリーム検索技術について研究した.特に,XMLテキスト高速な木パターン照合処理技術と,シソーラアスやアノテーション等のメタデータを附加したストリームデータ検索技術を開発することに成功した(竹田・篠原・石野・喜田).
(3)系列パターン発見に関して,長大な系列データを対象とした効率よいパターン発見アルゴリズムを開発した(篠原・竹田・有村).また,部分文字列の頻度に基づくパターン抽出手法について,そのパターン抽出性能と計算性能の改良を行った(池田・笠原・喜田).さらに,前年度に開発したワイルドカードをもつ極大パターンに対する高速パターンアルゴリズムに関する研究成果が出版された.また,昨年度の研究で開発した系列パターン発見アルゴリズムがH17年6月に,2004年人工知能学会研究会優秀賞を受賞した(篠原・竹田・有村).さらに,前年度までに,研究項目2と3で開発した半構造パターン照合技法とオンライン発見手法を元に開発した,ストリームデータに関する半構造データ族に対する高速半構造パターン発見アルゴリズムの研究成果の論文集への採択が決定した(有村・喜田).
(4)応用研究として,現実の大規模高速ネットワークにおいて,実際に大量ネットワークデータに対するオンラインデータ収集と解析を行い,ネットワーク不正侵入検出に関する研究を行った(笠原・池田).

報告書

(4件)
  • 2005 実績報告書   研究成果報告書概要
  • 2004 実績報告書
  • 2003 実績報告書
  • 研究成果

    (40件)

すべて 2006 2005 2004 その他

すべて 雑誌論文 (28件) 文献書誌 (12件)

  • [雑誌論文] 単純な部分文字列照合によるWebからの書誌情報の抽出2006

    • 著者名/発表者名
      松本 英樹, 田中 省作, 池田 大輔, 平木 啓太
    • 雑誌名

      第30回ディジタル図書館ワークショップ (口頭発表)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Faster Pattern Matching Algorithm for Arc-Annotated Sequences2006

    • 著者名/発表者名
      Takuya Kida
    • 雑誌名

      Lecture Notes in Computer Science To appear

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Passive Server Detection and Banner Collection2006

    • 著者名/発表者名
      Y.Kasahara
    • 雑誌名

      CoreUniversity Seminar on Next Generation Internet

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Efficient Algorithms for Finding Frequent Substructures from Semi-structured Data Streams2006

    • 著者名/発表者名
      T.Asai, K.Abe, S.kawasoe, H.Arimura, S.Arikawa
    • 雑誌名

      Lecture Notes in Computer Science To appear

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Faster Pattern Matching Algorithm for Arc-Annotated Sequences2006

    • 著者名/発表者名
      Takuya Kida
    • 雑誌名

      Proc.-Federation on the Web, LNAI, Springer-Verlag (to appear)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Passive Server Detection and Banner Collection.2006

    • 著者名/発表者名
      Y.Kasahara
    • 雑誌名

      JSPS Core University Seminar on Next Generation Internet

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Efficient Algorithms for Finding Frequent Substructures from Semi-structured Data Streams2006

    • 著者名/発表者名
      T.Asai, K.Abe, S.Kawasoe, H.Arimura, S.Arikawa
    • 雑誌名

      Report from the 2004 Annual Meeting of japan Society for Artifical Intelligence (JSAI2004), JSAI, LNAI, Katsumi Nitta et al.(eds.), Springer-Verlag (in printng)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Faster Pattern Matching Algorithm for Arc-Annotated Sequences2006

    • 著者名/発表者名
      Takuya Kida
    • 雑誌名

      Lecture Notes in Computer Science (To appear)

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Passive Server Detection and Banner Collection2006

    • 著者名/発表者名
      Y.Kasahara
    • 雑誌名

      2006 JSPS Core-University Seminar on Next Generation Internet

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Efficient Algorithms for Finding Frequent Substructures from Semi-structured Data Streams2006

    • 著者名/発表者名
      T.Asai, K.Abe, S.Kawasoe, H.Arimura, S.Arikawa
    • 雑誌名

      Lecture Notes in Computer Science (To appear)

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 部分文字列増幅法による共通パタン発見アルゴリズム2005

    • 著者名/発表者名
      池田 大輔, 山田 泰寛, 廣川 左千男
    • 雑誌名

      情報処理学会論文誌 数理モデル化と応用 46・SIG 2(TOM 11)

      ページ: 56-66

    • NAID

      110002914186

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] An Approach to Analyzing Correlation between Songs/Artists Using iTMS Playlists2005

    • 著者名/発表者名
      Y.Dou, E.Itoh, S.Hirokawa, D.Ikeda
    • 雑誌名

      Proc. International Conference on Intelligent Agents,Web Technology and Internet Commerce IAWTIC'2005

      ページ: 28-30

    • NAID

      120006654585

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] A Bit-parallel Tree Matching Algorithm for Patterns with Horizontal VLDC's2005

    • 著者名/発表者名
      Hisashi Tsuji, Akira Ishino, Masayuki Takeda
    • 雑誌名

      Lecture Notes in Computer Science 3772

      ページ: 388-398

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 実績報告書 2005 研究成果報告書概要
  • [雑誌論文] 大規模データストリームのためのマイニング技術の動向2005

    • 著者名/発表者名
      有村博紀
    • 雑誌名

      電子情報通信学会論文誌D-1 J88-D-1・3

      ページ: 563-575

    • NAID

      110003207353

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 実績報告書 2005 研究成果報告書概要
  • [雑誌論文] Special Issue on Algorithmic Learning Thoery2005

    • 著者名/発表者名
      Sanjay Jain, Hiroki Arimura
    • 雑誌名

      Theoretical Computer Science 348・1-348・2

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] A Polynomial Space and Polynomial Delay Algorithm for Enumeration of Maximal Motifs in a Sequence2005

    • 著者名/発表者名
      Hiroki Arimura, Takeaki Uno
    • 雑誌名

      Lecture Notes in Computer Science 3827

      ページ: 724-737

    • NAID

      110003225066

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] An Approach to Analyzing Correlation between Songs/Artists Using iTMS Playlists2005

    • 著者名/発表者名
      Y.Dou, E.Itoh, S.Hirokawa, K.Ikeda
    • 雑誌名

      Proc.International Conference on Intelligent Agents, Web Technology and Internet Commerce (IAWTIC'2005)

      ページ: 28-30

    • NAID

      120006654585

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] A Bit-parallel Tree Matching Algorithm for Patterns with Horizontal VLDC's2005

    • 著者名/発表者名
      Hisashi Tsuji, Akira Ishino, Masayuki Takeda
    • 雑誌名

      Proc.12th International Symposium on String Processing and Information Retrieval (SPIRE 2005), Lecture Notes in Computer Science 3772, Springer

      ページ: 388-398

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Recent Development of Stream Data Mining Algorithms (In Japanese)2005

    • 著者名/発表者名
      H.Arimura
    • 雑誌名

      IEICE Transactions on Information and Systems Vol.J89-D, No.2

      ページ: 172-183

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] Special Issue on Algorithmic Learning Thoery2005

    • 著者名/発表者名
      Sanjay Jain, Hiroki Arimura
    • 雑誌名

      Theoretical computer Science 348(1-2)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] A Polynomial Space and Polynomial Delay Algorithm for Enumeration of maximal Motifs in a Sequence2005

    • 著者名/発表者名
      Hiroki Arimura, Takeaki Uno
    • 雑誌名

      Proc.the 16th Annual International Symposium on Algorithms and Computation (ISAAC'05), LNCS 3827, Springer

    • NAID

      110003225066

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2005 研究成果報告書概要
  • [雑誌論文] 部分文字列増幅法による共通パタン発見アルゴリズム2005

    • 著者名/発表者名
      池田 大輔, 山田 泰寛, 廣川 佐千男
    • 雑誌名

      情報処理学会論文誌:数理モデル化と応用 46・SIG 2(TOM 11)

      ページ: 56-66

    • NAID

      110002914186

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 大規模データストリームのためのマイニング技術の動向2005

    • 著者名/発表者名
      有村博紀
    • 雑誌名

      電子情報通信学会論文誌 J88-D-I・2(印刷中)

    • NAID

      110003207353

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] データストリームのためのマイニング技術2005

    • 著者名/発表者名
      有村博紀, 喜田拓也
    • 雑誌名

      情報処理,情報処理学会 46・1

      ページ: 4-11

    • NAID

      110002768327

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Efficient Substructure Discovery from Large Semi-structured Data2004

    • 著者名/発表者名
      H.Arimura, H.Sakamoto他4名
    • 雑誌名

      IEICE Transactions on Information and Systems E87-D・12

      ページ: 2754-2763

    • NAID

      110003213885

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] An Efficient Algorithm for Enumerating Closed Patterns in Transaction Databases2004

    • 著者名/発表者名
      H.Arimura他3名
    • 雑誌名

      Proc.the 7th International Conference on Discovery Science (DS'04) LNAI3245

      ページ: 16-30

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Finding Optimal Pairs of Cooperative and Competing Patterns with Bounded Distance2004

    • 著者名/発表者名
      A.Shinohara, M.Takeda他5名
    • 雑誌名

      Proc.The 7th International Conference on Discovery Science (DS 2004) LNAI3245

      ページ: 32-46

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Pattern matching with taxonomic information2004

    • 著者名/発表者名
      T.Kida, H.Arimura
    • 雑誌名

      Proc.Asia Information Retrieval Symposium (AIRS'04)

    • NAID

      120000959147

    • 関連する報告書
      2004 実績報告書
  • [文献書誌] Hiroshi Sakamoto et al.: "Learning Elementary Formal Systems with Queries"Theoretical Computer Science. 298(1). 21-50 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Tatsuya Asai et al.: "Discovering Frequent Substructures in Large Unordered Trees"Proc.the 6th International Conference on Discovery Science (DS'03). 2843. 47-61 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Takeaki Uno et al.: "LCM : An Efficient Algorithm for Enumerating Frequent Closed Item Sets"Proc.ICDM'03 Workshop on Frequent Itemset Mining Implementations (FIMI'03). (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 有村 博紀: "計算学習理論における学習"人工知能学会誌. 18・5. 531-536 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Tatsuya Asai et al.: "半構造データマイニングにおけるパターン発見技法"電子情報通信学会論文誌. J87-D-1・2. 111-139 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Hiroki Arimura: "Efficient Text and Semi-structured Data Mining : Knowledge Discovery in the Cyberspace"The first Franco-Japanese Workshop on Information Search, Integration and Personalization (ISIP'03). (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Masayuki Takeda et al.: "Discovering Most Classificatory Patterns for Very Expressive Pattern Classes"Lecture Notes in Computer Science. 2843. 486-493 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Shunsuke Inenaga et al.: "Compact Directed Acyclic Word Graphs for a Sliding Window"Journal of Discrete Algorithms. (to appear). (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Shunsuke Inenaga et al.: "Linear-time off-line text compression by longest-first substitution"Lecture Notes in Computer Science. 8572. 137-152 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Hideo Bannai et al.: "Inferring Strings from Graphs and Arrays"Lecture Notes in Computer Science. 2747. 208-217 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Kensuke Baba et al.: "On the length of the minimum solution of word equations in one variable"Lecture Notes in Computer Science. 2747. 189-197 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Satoru Miyamoto et al.: "Ternary Directed Acyclic Word Graphs"Lecture Notes in Computer Science. 2759. 120-130 (2003)

    • 関連する報告書
      2003 実績報告書

URL: 

公開日: 2003-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi