2008 Fiscal Year Annual Research Report
連続データストリームに対する高度なパターン照合の研究
Project/Area Number |
20700001
|
Research Institution | Hokkaido University |
Principal Investigator |
喜田 拓也 Hokkaido University, 大学院・情報科学研究科, 准教授 (70343316)
|
Keywords | データストリーム / パターン照合 / 情報検索 / 文字列処理 / データ圧縮 / 接尾辞木 / VF符号 |
Research Abstract |
近年, 自動測定技術の発展により, センサーデータや通信記録などの連続データストリームに対する大規模データ処理が重要になっている. こうしたストリーム型のデータに対してパターン照合を行う場合, 単純な文字列の照合とは異なる困難さがある. 第一に, 入力データ系列の各要素は, 検索パターンの各要素に対してある程度の誤差を許して一致していればよく, 厳密に一致する性質を利用した文字列照合の技術がそのままでは適用できない. 第二に, 照合処理の過程においてリアルタイム性が要求され, また過去のデータに対してアクセスすることが困難であることが挙げられる. 本研究では, このような連続データストリームに対する高速・高度なパターン照合技術の確立を目指している. 本年度は, これまでに得られた多次元の数値データストリームに対するパターン照合に, 文字列型データストリームや分類階層概念型データストリームに対するパターン照合を組み合わせ, より複雑なクエリに対する統合的な照合システムの枠組みを提案した. 一方で, 巨大なストリームデータを蓄えるための検索可能なデータ圧縮技術の要求も高まっており, 検索効率を保ちつつ圧縮率の高い圧縮法の開発にも取り組んだ. その結果, 刈り込み接尾辞木を利用することで圧縮後の符号語がすべて等しいというパターン照合に適した特徴を備えつつ, 既存のハフマン符号などよりも高い圧縮率を得られる符号法の開発に成功した.
|
Research Products
(5 results)