研究課題/領域番号 |
22300010
|
研究機関 | 九州大学 |
研究代表者 |
竹田 正幸 九州大学, 大学院・システム情報科学研究院, 教授 (50216909)
|
研究分担者 |
瀧本 英二 九州大学, 大学院・システム情報科学研究院, 教授 (50236395)
篠原 歩 東北大学, 大学院・情報科学研究科, 教授 (00226151)
坂本 比呂志 九州工業大学, 情報工学部, 准教授 (50315123)
坂内 英夫 九州大学, 大学院・システム情報科学研究院, 准教授 (20323644)
畑埜 晃平 九州大学, 大学院・システム情報科学研究院, 助教 (60404026)
|
キーワード | アルゴリズム / 暗号・認証等 / 情報工学 / ディレクトリ・情報検索 / ソフトウェア開発効率化 |
研究概要 |
本年度は,圧縮テキストデータ上での多様な質問処理の高速化を目指し,以下の成果を得ることができた。 A.圧縮テキスト上の高速パターン照合アルゴリズムの開発 多くの圧縮ファイルフォーマットの抽象化としてStraight-Line Program (SLP)をとりあげ、SLP上におけるパターン照合アルゴリズムの開発を行った。部分文字列パターンについては1990年代より研究が行われてきたが、ここではより表現力の高い部分列パターン族を対象に、既存研究による圧縮パターン照合アルゴリズムの計算量を大きく改善した。また、これをVLDCパターン族に拡張した。さらには、より広い圧縮フォーマットを包含することで知られるCollage systemについて、これらのアルゴリズムを拡張することにも成功した。 B.圧縮テキスト上のq-グラム統計計算アルゴリズムの開発 SLP上でq-グラム統計を求める多項式時間アルゴリズムを開発した。これは、「圧縮データマイニング」の第一歩として大変意義のある結果である。また、Re-pair圧縮アルゴリズムをSLP上で模倣する多項式アルゴリズムの開発にも成功した。このことは、一度データを格納したのちに「再圧縮」する作業が効率的に行えることを示している。
|