• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2007 Fiscal Year Annual Research Report

大規模半構造データからの高速知識発見システムの開発

Research Project

Project/Area Number 17200011
Research InstitutionFUJITSU LABORATORIES LTD.

Principal Investigator

岡本 青史  FUJITSU LABORATORIES LTD., ナレッジ研究センター, 主任研究員 (90399717)

Co-Investigator(Kenkyū-buntansha) 竹田 正幸  九州大学, 大学院・システム情報科学研究院, 教授 (50216909)
篠原 歩  東北大学, 大学院・情報科学研究科, 教授 (00226151)
喜田 拓也  北海道大学, 大学院・情報科学研究科, 准教授 (70343316)
坂本 比呂志  九州工業大学, 情報工学部, 准教授 (50315123)
平田 耕一  九州工業大学, 情報工学部, 准教授 (20274558)
Keywords半構造データ / XML / 知識発見 / パターン発見 / パターン照合 / データ圧縮
Research Abstract

【半構造データ処理基盤】XMLデータストリームを対象とした研究では、XPath対応を強化し、XPath質問式を高速に評価するアルゴリズムを開発した。テキスト圧縮による文字列照合の高速化の研究については、圧縮率及び照合速度をさらに向上させるアルゴリズムの開発に成功した。また、圧縮文字列中の最長共通部分文字列と、すべての回文を高速に発見するアルゴリズムも開発した。
半構造データ処理のための効率のよい索引構造の研究では、昨年度までの研究成果を用いてWeb文書からのランタイムかつ精度の高いキーワード抽出機構を構築した。また、有向グラフに対するラベル付け問題に対して、前処理時間、応答時間および領域計算量を削減した効率的な索引付けを提案し、実験によってその有効性を示した。さらに、このラベル付けアルゴリズムを応用し、グラフ上の距離を高速に計算する手法を提案した。
木の類似性発見の理論的研究では、高速な無順浮木に適用可能な木カーネルとして、二葉木カーネルを設計した。これは葉が高々2つであるような木の頻度を数え上げることで計算することができる。
【半構造データからのパターン発見】時系列データを対象とした研究では、エピソードマイニングの研究を深化させ、細菌感受性検査データに適用することでその効果を検証すると共に、直列エピソードの情報だけから構成できるエピソードと非並列エピソードが等価になることを理論的に示した。また、述語を組み合わせた複雑な時系列パターンの効率よい照合アルゴリズムを開発した。
Webデータからの知識発見への応用としては、パターン発見基盤技術を援用したスパム検出に取り組んだ。我々は、文字列の「異質性」を定量化し、異種性の計算に必要な文字列上の同値関係に基づく同値類の効率的計算法を提案することでスパム検出の開発に成功した。

  • Research Products

    (24 results)

All 2008 2007

All Journal Article (20 results) (of which Peer Reviewed: 20 results) Presentation (4 results)

  • [Journal Article] プロパティ接尾辞木のオフライン線形時間構築アルゴリズム2008

    • Author(s)
      上村卓史, 他2名
    • Journal Title

      電子情報通信学会論文誌D-1 Vol.J91-D, No.3

      Pages: 595-607

    • Peer Reviewed
  • [Journal Article] Mining Maximal Flexible Patterns in a Sequence2008

    • Author(s)
      Hiroki Arimura, 他1名
    • Journal Title

      Lecture Notes in Artificial Intelligence(Post Proceedings of 5th Workshop on Learning with Logics and Logics for Learning) 4914(To appear)

    • Peer Reviewed
  • [Journal Article] An Adaptive Algorithm for Splitting Large Sets of Strings and Its Application to Efficient External Sorting2008

    • Author(s)
      Tatsuya Asai, 他2名
    • Journal Title

      Working Notes of Workshops on Algorithms for Large-Scale Information Processing in Knowledge Discovery, et. al.

      Pages: 17-28

    • Peer Reviewed
  • [Journal Article] Improving Named Entity Extraction Accuracy Using Unlabeled Data and Several Extractors2008

    • Author(s)
      Tomoya Iwakura, 他1名
    • Journal Title

      Proc. the 8th International Conference on Intelligent Text Processing and Computational Linguistics (To appear)

    • Peer Reviewed
  • [Journal Article] A Simple Characterization on Serially Constructible Episodes2008

    • Author(s)
      Takashi Katoh, 他1名
    • Journal Title

      Lecture Notes in Artificial Intelligence(Proc. the 12th Pacific-Asia Conference on Knowledge Discovery and Data Mining) (To appear)

    • Peer Reviewed
  • [Journal Article] An Efficient Unordered Tree Kernel and Its Application to Glycan Classification2008

    • Author(s)
      Tetsuji Kuboyama, 他2名
    • Journal Title

      Lecture Notes in Artificial Intelligence(Proc. the 12th Pacific-Asia Conference on Knowledge Discovery and Data Mining) (To appear)

    • Peer Reviewed
  • [Journal Article] Computing Longest Common Substring and All Palindromes from Compressed Strings2008

    • Author(s)
      Wataru Matsubara, 他5名
    • Journal Title

      Lecture Notes in Computer Science(Proc. the 34th International Conference on Current Trends in Theory and Practice of Computer Science) 4910

      Pages: 364-375

    • Peer Reviewed
  • [Journal Article] 漸増的なパストライ構築に基づく高速・軽量XML文書フィルタリング2007

    • Author(s)
      萩尾一仁, 他3名
    • Journal Title

      DBSJ Letters 6(2)

      Pages: 5-8

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] Efficient Schema Matching Algorithm Based on Pre-Checking2007

    • Author(s)
      Kengo Kubo, 他3名
    • Journal Title

      Systems and Computers in Japan 38

      Pages: 143-151

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] 高速な到達可能性判定のための規模耐性の高い索引付け2007

    • Author(s)
      中村有作, 他2名
    • Journal Title

      DBSJ Letters 6(1)

      Pages: 77-80

    • Description
      「研究成果報告書概要(和文)」より
    • Peer Reviewed
  • [Journal Article] Time and Space Efficient Discovery of Maximal Geometric Graphs.2007

    • Author(s)
      Hiroki Arimura, 他2名
    • Journal Title

      Lecture Notes in Artificial Intelligence(Proc. 10th International Conference on Discovery Science) 4755

      Pages: 42-55

    • Peer Reviewed
  • [Journal Article] An Assistant Tool for Concealing Personal Information in Text2007

    • Author(s)
      Tomoya Iwakura, 他1名
    • Journal Title

      Lecture Notes in Computer Science(Proc. the 12th International Conference on Human-Computer Interaction) 4558

      Pages: 38-46

    • Peer Reviewed
  • [Journal Article] Fast Training Methods of Boosting Algorithms for Text Analysis2007

    • Author(s)
      Tomoya Iwakura, 他1名
    • Journal Title

      Proc. the International Conference on Recent Advances in Natural Language Processing

      Pages: 274-279

    • Peer Reviewed
  • [Journal Article] An Assistant Interface for Finding Query-Related Proper Nouns2007

    • Author(s)
      Tomoya Iwakura, 他2名
    • Journal Title

      Lecture Notes in Computer Science(Proc. the 11th International Conference on Knowledge-Based Intelligent Information and Engineering Systems) 4693

      Pages: 1238-1245

    • Peer Reviewed
  • [Journal Article] Mining Frequent Elliptic Episodes from Event Sequence2007

    • Author(s)
      Takashi Katoh, 他1名
    • Journal Title

      Proc. the 5th Workshop on Learning with Logic and Logics for Learning

      Pages: 46-52

    • Peer Reviewed
  • [Journal Article] Mining Frequent Diamond Episodes from Event Sequences2007

    • Author(s)
      Takashi Katoh, 他2名
    • Journal Title

      Lecture Notes in Artificial Intelligence(Proc. the 4th International Conference on Modeling Decisions for Artificial Intelligence) 4617

      Pages: 477-488

    • Peer Reviewed
  • [Journal Article] Extraction of Sectorial Episodes Representing Changes for Drug Resistance and Replacements of Bacteria2007

    • Author(s)
      Takashi Katoh, 他4名
    • Journal Title

      Proc. the IEEE/ICME International Conference on Complex Medical Engineering

      Pages: 304-309

    • Peer Reviewed
  • [Journal Article] Reducing Trials by Thinning-Out in Skill Discovery2007

    • Author(s)
      Hayato Kobayashi, 他3名
    • Journal Title

      Lecture Notes in Computer Science(Proc. the 10th International Conference on Discovery Science) 4755

      Pages: 127-138

    • Peer Reviewed
  • [Journal Article] A Minimal Acyclic Generalization with Tractable Removal of Redundancy2007

    • Author(s)
      Megumi Kuwabara, 他2名
    • Journal Title

      Proc. the 5th Workshop on Learning with Logic and Logics for Learning

      Pages: 25-31

    • Peer Reviewed
  • [Journal Article] Unsupervised Spam Detection Based on String Alienness Measures2007

    • Author(s)
      Kazuyuki Narisawa, 他3名
    • Journal Title

      Lecture Notes in Computer Science(Proc. the 10th International Conference on Discovery Science) 4755

      Pages: 161-172

    • Peer Reviewed
  • [Presentation] 有向グラフ上の最短距離の効率的な計算2008

    • Author(s)
      原口新平, 他2名
    • Organizer
      第19回データ工学ワークショップ(DEWS 2008)
    • Place of Presentation
      フェニックス・シーガイア・リゾート(宮崎県)
    • Year and Date
      2008-03-11
    • Description
      「研究成果報告書概要(和文)」より
  • [Presentation] ウェブ閲覧における効率的なキーワード抽出とその利用2007

    • Author(s)
      上村卓史, 他2名
    • Organizer
      データベースとWeb情報システムに関するシンポジウム(DBWeb 2007)
    • Place of Presentation
      東京大学 生産技術研究所
    • Year and Date
      2007-11-28
    • Description
      「研究成果報告書概要(和文)」より
  • [Presentation] ビット並列手法に基づく大規模連続ストリームパターン照合2007

    • Author(s)
      斉藤智哉, 他2名
    • Organizer
      第6回情報科学技術フォーラム(FIT2007)
    • Place of Presentation
      中京大学 豊田キャンパス
    • Year and Date
      2007-09-05
    • Description
      「研究成果報告書概要(和文)」より
  • [Presentation] 圧縮アルゴリズムLCA法の改良と実験による評価2007

    • Author(s)
      丸山史郎, 他1名
    • Organizer
      電子情報通信学会 コンピュテーション研究会
    • Place of Presentation
      京都大学(桂キャンパス)
    • Year and Date
      2007-04-26
    • Description
      「研究成果報告書概要(和文)」より

URL: 

Published: 2010-02-04   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi