2018 Fiscal Year Research-status Report
最適な作業領域の文法圧縮に基づく索引とストリームデータからの知識発見への応用
Project/Area Number |
18K18111
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
高畠 嘉将 九州工業大学, 大学院情報工学研究院, 特任助教 (20807010)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 圧縮索引 / データ圧縮 / 秘匿計算 / 移動付き編集距離 |
Outline of Annual Research Achievements |
本研究ではTBを超えて増加し続ける世代管理システムやゲノムデータベース上の繰り返しの多い文書データを高速かつ省メモリに小さく圧縮しながら,その圧縮データ上でリアルタイムのキーワード検索可能な世界最小の作業領域の圧縮索引の開発を目指している.本年度は,高速かつ省メモリに小さく圧縮するデータ圧縮法の開発に注力し,以下の成果を上げている.省メモリかつ小さく圧縮可能なRLBWTと呼ばれるデータ圧縮法を実用的に高速化する方法を開発した.また,LZDと呼ばれる実用的に高速かつ小さく圧縮可能なデータ圧縮を基盤として,理論的に省メモリかつ高速に圧縮可能でかつ実用的にもLZDと同等の性能を示すLZ-ABTを開発した.さらに文法圧縮と呼ばれるデータ圧縮の中で最高の圧縮率を達成する一方で,入力の10倍近くのメモリ使用量を使用するRePairと呼ばれる圧縮法の世界初の圧縮作業領域計算を提案した.またこれらの研究しているデータ圧縮を応用した移動付き編集距離と呼ばれる2つの文字列間の類似度計算の秘匿計算も開発した.これにより,Aという人が持つ文字列とBという人が持つ文字列をお互いが持つ文字列を知ることなく,お互いの文字列の移動付き編集距離の計算を可能にした.この技術はDNAなどの他人に知られたくない個人情報の類似度計算などの応用が期待できる.これらの成果は各種国際会議および原著論文として発表している.以上のように本年度は目指している圧縮索引の基盤技術の開発を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
目指している圧縮索引の基盤技術であるデータ圧縮の開発および秘匿計算への拡張を行い,査読付き国際会議論文3件および原著論文1件の成果を上げており,当該研究が順調に進んでいるといえる.
|
Strategy for Future Research Activity |
本年度および2017年度に開発したデータ圧縮をキーワード検索可能に拡張し,当該研究が目指す圧縮索引の開発を行っていく.
|
Research Products
(5 results)