1997 Fiscal Year Annual Research Report
テキスト圧縮に基づく高速パターン照合アルゴリズムの研究
Project/Area Number |
09680343
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Kyushu University |
Principal Investigator |
竹田 正幸 九州大学, 大学院・システム情報科学研究科, 助教授 (50216909)
|
Co-Investigator(Kenkyū-buntansha) |
篠原 歩 九州大学, 大学院・システム情報科学研究科, 助教授 (00226151)
|
Keywords | テキストデータベース / パターン照合アルゴリズム / 情報検索 / データ圧縮 / 圧縮テキスト上のパターン照合 |
Research Abstract |
従来,ファイル圧縮の目的は二次記憶領域の効率的利用にあった.したがって,現在広く使われている圧縮法は,圧縮率を第1の基準として選定されたものである.本研究では,この発想を大きく転換し,パターン照合の高速化を図るためにファイル圧縮を行うものと考える.そこで,本研究では,既存の圧縮方式にこだわらず,新しい圧縮方式を提唱し,そのもとでの高速パターン照合アルゴリズムを開発する.本研究により,データ圧縮の分野のみならず,パターン照合を初めとするテキスト処理の分野に,実用性の高い研究課題を提供することに繋がり,当該分野の研究の発展にも貢献することができる.本年度は,以下の研究成果を得た. (1)UNIX標準の圧縮プログラムであるCompressで使用されているLZW圧縮法に関して,複数パターン照合アルゴリズムを開発した. (2)上記(1)のアルゴリズムを実働化し,復号したのちに照合する従来手法と比べ2倍程度高速になることを実証した. 以上の成果をまとめた論文が,1998年の3月末に米国で開催される予定のデータ圧縮に関する最も権威ある国際会議(DCC)に採択されており,この会議に出席して研究成果を発表する予定である.
|
-
[Publications] T.Kida et al.: "Multiple Pattern Matching in LZW Compressed Text" Proc.Data Compression Conference,DCC'98. (to appear). (1998)
-
[Publications] 山崎真由美ほか: "MDL原理を用いた和歌データからのパターン抽出" 情報処理学会研究報告. 37-5. 29-34 (1998)