研究課題/領域番号 |
18K18111
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 九州工業大学 |
研究代表者 |
高畠 嘉将 九州工業大学, 大学院情報工学研究院, 特任助教 (20807010)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2019年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2018年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | データ圧縮 / 圧縮索引 / 圧縮情報処理 / 文法圧縮 / BWT / 文字列検索 / ランダムアクセス / 圧縮検索 / 秘匿計算 / 移動付き編集距離 / テキストデータ圧縮 / オンラインアルゴリズム |
研究成果の概要 |
繰り返しを多く含む文書データはTBを超えて,今なお増加し続けている.本研究ではそのような増加し続ける巨大ストリームデータを圧縮サイズに比例した作業領域で高速に圧縮可能なデータ圧縮である文法圧縮及びORLBWTを開発した.また,その圧縮データ上で動作する様々な圧縮情報処理技術を開発した.当初の目的である巨大ストリームデータ上のリアルタイムキーワード検索可能な文法圧縮索引の開発には至らなかったが,ORLBWTの構築を実用的に高速化し,そのORLBWT上で動作する高速リアルタイムキーワード検索可能な圧縮索引[Bannai et al. TCS2020]への礎を築いた.
|
研究成果の学術的意義や社会的意義 |
開発した文法圧縮やOnline Run-Length BWT (ORLBWT)をTB超のデータをさらに省メモリかつ高速に圧縮可能になった.また,開発したORLBWTを応用したリアルタイムキーワード検索可能な圧縮索引を用いることで巨大なストリームデータから効率的に情報抽出可能となった.また,開発した各種圧縮情報処理技術を応用することで巨大なストリームデータからのリアルタイムの知識発見が可能とすることが期待できる.
|