• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

情報圧縮によるテキストデータベースの高速化

研究課題

研究課題/領域番号 07558159
研究種目

基盤研究(A)

配分区分補助金
応募区分展開研究
研究分野 計算機科学
研究機関九州工業大学

研究代表者

篠原 武  九州工業大学, 情報工学部, 教授 (60154225)

研究分担者 深町 修一  九州工業大学, 情報工学部, 助手 (30274559)
下薗 真一  九州工業大学, 情報工学部, 助教授 (70243988)
石坂 裕毅  九州工業大学, 情報工学部, 助教授 (70260726)
杉本 典子  九州工業大学, 情報工学部, 教務職員 (80271120)
有村 博紀  九州工業大学, 情報工学部, 助教授 (20222763)
研究期間 (年度) 1995 – 1997
研究課題ステータス 完了 (1997年度)
配分額 *注記
3,700千円 (直接経費: 3,700千円)
1997年度: 1,300千円 (直接経費: 1,300千円)
1996年度: 2,400千円 (直接経費: 2,400千円)
キーワード情報検索 / 逐次パターン照合 / 情報圧縮 / テキストデータベース
研究概要

本研究の目的は、情報圧縮による逐次パターン照合処理の高速化技法を確立するとともに、そのテキストデータベースにおける有効性を実証することにある.
逐次処理の遅さの主な原因として,データの転送コストが考えられる.このコストを軽減するためには,情報圧縮の技術を用い,圧縮したデータを復号することなく探索する手法が有効である.
本研究では,テキストデータの標本として,
●遺伝子情報データ
●図書館データ
●英文テキストデータ
の3種のものを取り扱うこととしている.平成9年度の研究では,主として英文テキストデータを対象にして,平成7年度および平成9年度に設計したアルゴリズムをさらに改良するための研究を行った.並列化による高速化パターン照合およびBPE符号による圧縮技法に関する研究の結果,つぎのことがわかった.
並列化によるパターン照合の高速化は,テキストを分割し,それぞれを並列に処理することで達成できるが,その際,分割したテキストを個々のプロセッサに配送するコストをできるだけ小さくすることが重要となる.このコストを小さくするために情報圧縮を用いればよいのであるが,ハフマン符号のような可変長符号を用いている場合には,テキストを分割するために,テキストを走査する必要が生じ,この走査は並列化できないという問題がある.BPE符号においては,固定長符号を用いるので,こうした問題を生ずることはなく,また英文テキストであれば,50%程度の高い圧縮率を達成できる.

報告書

(4件)
  • 1997 実績報告書   研究成果報告書概要
  • 1996 実績報告書
  • 1995 実績報告書
  • 研究成果

    (29件)

すべて その他

すべて 文献書誌 (29件)

  • [文献書誌] 宮崎 哲司: "圧縮された日本語テキストのためのパターン照合機械の設計" 情報処理学会第51回全国大会講演論文集. 4. 239-240 (1995)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] 深町 修一: "文字列パターン照合のための損失のあるデータ圧縮" 電子情報通信学会技術研究報告. 95. 41-48 (1995)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] Michiyo Yamaguchi: "Finding minimal generalization over regular patterns with alphabet indexing" Proc.the 7th Workshop on Genome Informatics. 51-60 (1996)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] Takeshi Shinohara: "Inductive inference of unbounded unions of pattern languages from positive data" Proc the 7th International Workshop on Algorithmic Learning Theory(Lecture Notes in Artificial Intelligence). 1160. 256-271 (1996)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] Naoyuki Harada: "A class of elementary formal systems that has an efficient parsing algorithm" The 7th European-Japanese Conference on Information Modelling and Knowledge Bases. 89-101 (1997)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] Hiroki Arimura: "Learning unions of tree patterns using queries" Theoretical Computer Science(Netherlands). 185. 47-62 (1997)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] K.P.Jantke, T.Shinohara, T.Zeugmann(Eds.): "Algorithmic Learning Theory" Springer-Verlag, 319 (1995)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] H.Arimura, T.Shinohara: "Logical genetalization for learning with background knowledge" ICLP '95 post-Conference Workshop on Inductive Logic Programming. IA-TR-95-03. 1-11 (1995)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] T.Shinohara, H.Arimura: "Inductive inference of unbounded unions of pattern languages from positive data" Proc.the 7th International Workshop on Algorithmic Learning Theory (Lecture Notes in Artificial Intelligennce 1160). 256-271 (1996)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] M.Yamaguchi, S.Shimozono, T.Shinohara: "Finding minimal generalization over regular patterns with alphabet indexing" Proc.the 7th-Workshop on Genome Informatics. 51-60 (1996)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] S.Matsumoto, A.Shinohara, H.Arimura, T.Shinohara: "Learning subsequence languages" Information Modelling and Knowledge Bases, VIII,IOS Press. 335-344 (1997)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] N,Harada, S.Arikawa, H.Ishizaka: "A class of elementary formal systems that has an efficient parsing algorithm" Information Modelling and knowledge Bases, VIII,IOS Press. 89-101 (1997)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] H.Arimura, H.Ishizaka, T.Shinohara: "Learning unions of tree patterns using queries" Theretical Computer Science (Netherlands). 47-62 (1997)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] K.P.Jantke, T.Shinohara, T.Zeugmann (Eds.): Algorithmic Learning Theory. (Lecuture Notes in Artificial Intelligence 997), Springer-Verlag, 319 (1995)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] H.Arimura,H.Ishizaka,T.Shinohara: "Learning unions of tree patterns using queries" Theoretical Computer Science(Netherlands). 185. 47-62 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 有村博紀,渡木厚,下薗真一: "Maximum agreement problem for word association patterns" 電子情報通信学会コンピュテーション研究会. 92-102 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 林,石坂,篠原歩: "局面検索方式将棋棋譜データベースの開発" 平成9年度電気関係学会九州支部連合大会. (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 宮崎 哲司,深町 修一,篠原,武: "マルコフモデルを用いた圧縮データのための文字列パターン照合" 情報基礎論ワークショップ(LAシンポジウム). (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] 遠里 由佳子,有村 博紀,篠原 武: "概念階層を持つパターン言語の学習可能性" 情報基礎論ワークショップ(LAシンポジウム). (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] K.Hirata,S.Shimozono,A.Shinohara: "On the hardness of approximating the minimum consistent OBDD problem" Lecture Notes in Computer Science. 1097. 112-123 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] N.Sugimoto,K.Hirata,H.Ishizaka: "Constructive learning of translations based on dictionaries" Proc.the 7th International Workshop on Algorithmic Learning Theory (Lecture Notes in Artificial Intelligence). 1160. 177-184 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] T.Shinohara,H.Arimura: "Inductive inference of unbounded unions of pattern languages from positive data" Proc.the 7th International Workshop on Algorithmic Learning Theory (Lecture Notes in Artifical Intelligence). 1160. 256-271 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] M.Yamaguchi,S.Shimozono,T.Shinohara: "Finding minimal generalization over regular patterns with alphabet indexing" Proc.the 7th Workshop on Genome Informatics. 51-60 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] 宮崎哲司: "圧縮された日本語テキストのためのパターン照合機械の設計" 情報処理学会第51回全国大会講演論文集. 4. 239-240 (1995)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] 深町修一: "文字列パターン照合のための損失のあるデータ圧縮" 電子情報通信学会技術研究報告. 95. 41-48 (1995)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] 篠原 武: "複数文字列パターンによる正例からのタンパク質モチーフの発見" 1995年度人工知能学会全国大会(第9回)講演論文集. 93-96 (1995)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] 有村博紀: "木パターン言語の和の質問による学習" 1995年度人工知能学会全国大会(第9回)講演論文集. 73-76 (1995)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] 山口美千代: "複数文字列パターンによるアミノ酸配列からのタンパク質モティーフの発見" 情報処理学会研究報告,情報学基礎. No.38. 33-40 (1995)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] Hiroki Arimura: "Learning Unions of Tree Patterns Using Queries" Proc.the 6th International Workshop on Algorithmic Learning Theory (Lecture Notes in Artificial Intelligence 997,Springer-Verlag). 997. 66-79 (1995)

    • 関連する報告書
      1995 実績報告書

URL: 

公開日: 1996-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi