2014 Fiscal Year Annual Research Report
時系列データの再帰的圧縮過程における最適停止性の研究
Publicly Offered Research
Project Area | Initiative for High-Dimensional Data-Driven Science through Deepening of Sparse Modeling |
Project/Area Number |
26120516
|
Research Institution | University of Toyama |
Principal Investigator |
村山 立人 富山大学, 大学院理工学研究部(工学), 講師 (80360650)
|
Project Period (FY) |
2014-04-01 – 2016-03-31
|
Keywords | センシング / データマイニング / 不可逆データ圧縮 |
Outline of Annual Research Achievements |
本研究の目的は、深宇宙探査やゲノム情報処理などのデータマイニング関連分野で、逐次的に記録されている時系列データの縮約手続きに関する革新的原理の提唱とその検証である。特に、本研究は、センサーなどの計測デバイスがネットワークと融合していく計算機科学の技術動向に注目した。そして、この最新の技術動向を念頭に、本研究では計測デバイスの有限の記憶領域に無限に続く時系列を再帰的に圧縮していく理想的な方法を、歪み測度を畳み込んだ効用積分を最小化させる最適停止問題の立場で解明する。
単体の計測デバイスに記憶容量を超えた時系列を縮約・格納していく立場では、記憶領域の全域が常時使用されている。そのため、新しいデータが計測されるごとに、記憶領域の空きスペースを圧縮によって毎回確保する必要に迫られる。しかし、この圧縮の前に、過去の時系列を一時的に復号・展開する過程が不可欠で(この時にネットワーク資源が必要)、格納データは再帰的に歪んでいく。この結果、格納データの忠実性は、畳み込み形式の積分で評価される。
しかし、この復号・再圧縮の繰り返し操作を、どの程度の再帰深度まで許容すべきかは自明ではなく、ここでの最適停止性が実用上の課題となる。本研究では、この課題の解決を最終的な研究目的として設定する。本研究の内容は、これまでに受託した特定領域研究(研究課題番号18079015)と挑戦的萌芽研究(研究課題番号24650073)の内容と関連深い。応募にあたっては、上記の先行課題との継続性及び研究資産の継承可能性等も検討し、適切なテーマ設定となっている。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
上記の研究目的を達成するために、本研究の研究計画では大きく分けて2つのアプローチをとっている。最良符号による不可逆圧縮過程の実現を前提にした情報理論的アプローチと、増分分解という実装技術を援用した計算機科学的アプローチである。
このうち、増分分解は、テキストファイルに対する可逆圧縮技術(LZ78アルゴリズム)に実装されている計算機科学の方法である。情報源クラスに関する予備知識が全くない状況でも、データ系列を適応的に圧縮・復号する機構を提供することが知られている。平成26年度は、この増分分解を緩和し、適応的な不可逆圧縮過程を計算機に実装するアルゴリズムの開発を試みた。しかし、計画段階で予想していた十分な符号化性能には到達しなかった。
|
Strategy for Future Research Activity |
今後は、情報理論的アプローチに特化し、本研究の主要目的である時系列データの縮約手続きに関する革新的原理の提唱とその検証を目指す。具体的には、挑戦的萌芽研究(研究課題番号24650073)の知見を援用し、時系列データの十分統計量の再構成問題を分析することで、この計測状況に適した非自明な不可逆圧縮過程の特徴づけと定式化を行う。
|