2010 Fiscal Year Annual Research Report
超高速圧縮データストリーム処理に基づく軽量XMLデータベース管理システム基盤技術
Project/Area Number |
22300010
|
Research Institution | Kyushu University |
Principal Investigator |
竹田 正幸 九州大学, 大学院・システム情報科学研究院, 教授 (50216909)
|
Co-Investigator(Kenkyū-buntansha) |
瀧本 英二 九州大学, 大学院・システム情報科学研究院, 教授 (50236395)
篠原 歩 東北大学, 大学院・情報科学研究科, 教授 (00226151)
坂本 比呂志 九州工業大学, 情報工学部, 准教授 (50315123)
坂内 英夫 九州大学, 大学院・システム情報科学研究院, 准教授 (20323644)
畑埜 晃平 九州大学, 大学院・システム情報科学研究院, 助教 (60404026)
|
Keywords | アルゴリズム / 暗号・認証等 / 情報工学 / ディレクトリ・情報検索 / ソフトウェア開発効率化 |
Research Abstract |
本年度は,圧縮テキストデータ上での多様な質問処理の高速化を目指し,以下の成果を得ることができた。 A.圧縮テキスト上の高速パターン照合アルゴリズムの開発 多くの圧縮ファイルフォーマットの抽象化としてStraight-Line Program (SLP)をとりあげ、SLP上におけるパターン照合アルゴリズムの開発を行った。部分文字列パターンについては1990年代より研究が行われてきたが、ここではより表現力の高い部分列パターン族を対象に、既存研究による圧縮パターン照合アルゴリズムの計算量を大きく改善した。また、これをVLDCパターン族に拡張した。さらには、より広い圧縮フォーマットを包含することで知られるCollage systemについて、これらのアルゴリズムを拡張することにも成功した。 B.圧縮テキスト上のq-グラム統計計算アルゴリズムの開発 SLP上でq-グラム統計を求める多項式時間アルゴリズムを開発した。これは、「圧縮データマイニング」の第一歩として大変意義のある結果である。また、Re-pair圧縮アルゴリズムをSLP上で模倣する多項式アルゴリズムの開発にも成功した。このことは、一度データを格納したのちに「再圧縮」する作業が効率的に行えることを示している。
|
Research Products
(14 results)