2011 Fiscal Year Annual Research Report
超高速圧縮データストリーム処理に基づく軽量XMLデータベース管理システム基盤技術
Project/Area Number |
22300010
|
Research Institution | Kyushu University |
Principal Investigator |
竹田 正幸 九州大学, 大学院・システム情報科学研究院, 教授 (50216909)
|
Co-Investigator(Kenkyū-buntansha) |
瀧本 英二 九州大学, 大学院・システム情報科学研究院, 教授 (50236395)
篠原 歩 東北大学, 大学院・情報科学研究科, 教授 (00226151)
坂本 比呂志 九州工業大学, 情報工学部, 准教授 (50315123)
坂内 英夫 九州大学, 大学院・システム情報科学研究院, 准教授 (20323644)
畑埜 晃平 九州大学, 大学院・システム情報科学研究院, 助教 (60404026)
|
Keywords | アルゴリズム / 暗号・認証等 / 情報工学 / ディレクトリ・情報検索 / ソフトウェア開発効率化 |
Research Abstract |
本研究では、圧縮データ処理に基づく軽量XMLデータベース管理システム基盤技術の確立を目指している。本年度は、主として、以下の成果を得ることができた。 A.圧縮テキスト上の高速パターン照合に適した文法圧縮アルゴリズムの開発 圧縮パターン照合に適した圧縮形式であるStraight-Line Program (SLP)をとりあげ、テキストからサイズの小さいSLPを得るための高速軽量な文法圧縮アルゴリズムの開発を行い、既存の文法圧縮アルゴリズムに比べて高い性能を示すことを実証した。 B.圧縮テキスト上のq-グラム統計計算アルゴリズムの開発. SLP上でq-グラム統計を求める多項式時間アルゴリズムを開発した。これは、「圧縮データマイニング」の第一歩として大変意義のある結果である。また、その高速化に成功し、「圧縮による高速化」という目標をも達成した。さらに、重複を許さないq-グラム統計を求める多項式時間アルゴリズムの開発にも成功した。 C.高速XMLデータストリームフィルタリング技術の開発. XMLデータストリーム処理アルゴリズムにはリアルタイム処理と省スペースが求められる。解が得られるたびに遅延なく出力するストリームアルゴリズムをeagerとよぶ。既存アルゴリズムは、計算時間・領域は効率的であるものの、lazyであるという欠点があった。本研究では、計算量を維持したまま、eagerに改善することに成功した。 D.その他 データベースシステムのもつ知的情報処理機能として、機械学習およびそれに基づく知識発見、分類に関する研究を行い、多くの成果を得た。また、圧縮率向上に寄与するオンライン予測に関する研究成果も得られた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
高速軽量な文法圧縮アルゴリズムの開発に成功し、文法圧縮の実用化への道筋をつけた。また、圧縮データ上でq-グラム統計を求めるアルゴリズムの効率化に取り組み、理論と実用の両面から優れた成果をあげることができた。
|
Strategy for Future Research Activity |
計画計画の進捗は順調であり、今後も計画に沿って進めていく。
|