2016 Fiscal Year Research-status Report
逐次仮説検定および十分統計量との関連に着目したVFデータ圧縮法の解析および設計
Project/Area Number |
15K06088
|
Research Institution | Shonan Institute of Technology |
Principal Investigator |
有村 光晴 湘南工科大学, 工学部, 講師 (80313427)
|
Project Period (FY) |
2015-10-21 – 2018-03-31
|
Keywords | データ圧縮 / 情報源符号化 / 情報理論 / VF符号 / 十分統計量 / 逐次仮設検定 |
Outline of Annual Research Achievements |
(1) 実用的なVFデータ圧縮法の一例として,チョムスキー標準系のある変形を用いるデータ圧縮アルゴリズムを考案し,これの性能を実験的に検証した.これは,系列中の連続する2シンボルの組から新しい1シンボルへの置き換えを繰り返すことによって圧縮を行うアルゴリズムである.このアルゴリズムを含むクラスとして,文脈自由文法を用いたデータ圧縮法が存在し,それでは複数の連続するシンボルを新しい1シンボルに置き換えることで圧縮を行う. 理論的には一般的な文脈自由文法を用いたアルゴリズムの性能解析が行われているが,実用的なメモリ量や計算速度を考えると,1シンボルに置き換えるシンボル数に自由度があるよりは,2シンボルに制限を掛けた方が効率が良い.また,このクラスに含まれるアルゴリズムはいくつか存在するが,性能解析はそれぞれのアルゴリズムに対して別個に行われており,統一した理論的な解析は存在しない. 今年度はまず,開始記号の生成規則のみ右辺が任意の長さであり,それ以外の生成規則の右辺の長さが2であるような文法を,準チョムスキー標準形と名付け,これを用いるデータ圧縮アルゴリズムとして,LZ78法,MPM法,BPE法の3種に対して実験的な評価を行ない,有効性を検証した.その結果,BPE法については改良の余地があるか不明であるものの,LZ78法及びMPM法については圧縮性能の改良の余地が存在することが明らかになった. (2) VF符号の性能解析として,タンストール符号とは異なる基準で最適化を行うVF符号を提案し,この符号の平均符号化レートが情報源のエントロピーに収束することを理論的に証明した. (3) ユニバーサルVF符号から抽出された漸近十分統計量を用いてVV符号を構築し,そのユニバーサル性を証明することについて,理論的な結果が得られた.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
逐次仮設検定とVFデータ圧縮アルゴリズムの関連性についての理論的な解析が遅れている. この理由を一言で述べると,VF符号そのものの理論解析がまだ不十分であり,一般情報源に対するVF符号の性能解析が簡単な形で与えられていないからである. 研究開始当初,VF符号の理論的解析については,以下の二点の結果が大きな結果として得られている.まず,定常無記憶情報源に対するタンストール符号について,情報源の確率分布が既知の場合の評価が得られている.また,これに対する記憶の存在する情報源への拡張が成されている.次に,VF符号として見做すことも可能なLZ符号について,様々な情報源クラスに対する理論的な性能評価が得られている.しかし,これについては,符号化全体をFV符号と解釈した結果ばかりであり,LZ符号をVF符号として見た結果は存在しない.以上の2つの結果のみがVF符号に関する情報理論的な結果であり,タンストール符号について情報源アルファベットが無限の場合などについて整理された結果がこれまでに十分得られている訳ではない.そこで本研究では,まずVF符号の理論解析を色々な面から進めることが必要であった. これまでの研究によって,いくつかの結果が得られているが,まだ基本的な結果である,可算無限アルファベット及び記憶のある情報源に対するVF符号の構築および性能解析が十分にできていないため,最近情報理論的な解析を行う際に標準的に用いられつつある,情報スペクトル的解析を完全な形式で与えることが出来ていない.
|
Strategy for Future Research Activity |
今後はまず,これまである程度研究の進んでいる,準チョムスキー標準形を用いたデータ圧縮法の性能解析を,十分統計量との関連を明らかにしながら進めていくことを計画している.最初に,とりあえず十分統計量を用いずに圧縮性能の理論解析を行い,ユニバーサル性を理論的に証明する.その後で,十分統計量と,符号化に用いているデータ構造との関連を見ることで,ユニバーサル性と十分統計量との関連を見いだすことを目指す. 並行して,研究の進捗が遅れているVF符号の一般情報源に対する性能解析を行うと共に,それと逐次仮設検定との理論的関連を明らかにすることを目指す.まずは,二値アルファベットで記憶の存在する系列を対象としてVF符号の理論的な性能評価を行うことを計画している.次に,可算無限アルファベットで無記憶の系列に対するVF符号の理論的な性質を明らかにすることを考えている.後者については,存在そのものがまだ明らかではない.この点については,FV符号とVF符号の双対性も視野に入れながら理論的な結果を出すことを計画している.この結果が出れば,VF符号と乱数生成との理論的な関係を構築することも視野に入れて研究を進めていく予定である.
|
Causes of Carryover |
今年度に実験的研究が進んだため,次年度から前倒し請求を行ってノート型パソコンを購入した.その端数が残ってしまった.
|
Expenditure Plan for Carryover Budget |
次年度に書籍購入,実験機器購入,及び国内の成果発表旅費として使用する計画である.
|
Research Products
(7 results)