2021 Fiscal Year Research-status Report
Blind detection of audio data hiding
Project/Area Number |
18K11301
|
Research Institution | Tokyo University of Information Sciences |
Principal Investigator |
西村 明 東京情報大学, 総合情報学部, 教授 (30286182)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | ステガナリシス / ステガノグラフィ / 情報ハイディング / 音声符号化 / 機械学習 |
Outline of Annual Research Achievements |
3G/4G携帯電話音声およびヴォイスレコーダ等で主に用いられているAMR音声符号化において、その符号化データのうちピッチディレイ値への情報ハイディングが実施されている場合に、その情報ハイディングの有無を情報秘匿前の音声信号無しでブラインド検出する手法を開発した。この手法は、4つあるサブフレームのうち偶数サブフレームにおいては、その量子化後データのヒストグラムの偏りが現れる特徴を利用する。具体的には、偶数サブフレームのヒストグラムを、秘匿無しと秘匿ありの符号化データから算出し、それらを学習データとして機械学習識別モデルを構築し、情報秘匿の有無を識別する。 従来法は、情報ハイディングに伴って母音等の有声音声が符号化された際のピッチデータに不連続性が生じることを、ピッチデータの遷移確率分布を機械学習することによって検出する手法であった。しかし、音声信号に対して雑音が重畳した場合には、ピッチデータに情報秘匿に伴う不連続に似た変化が生じるため、検出性能が低下すると考えられるが、このことはこれまで検証されていなかった。 提案手法と従来手法との情報秘匿検出実験結果の比較によって、従来手法は雑音重畳時に検出性能が大きく低下することが示された。また、提案手法は雑音重畳時の検出性能低下がほとんど無く、音声信号のみの符号化に対しても、提案手法のほうが検出性能が軒並み高いことが示された。さらに、ピッチが大きく変化する子音等の音声部分のピッチデータに情報を秘匿する手法に対しては、従来手法はほとんど検出ができなかったが、提案手法は高い検出性能を示した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
AMR符号化信号に対する情報ハイディングの有無を検出する際には、AMR符号化の8つのビットレートのうち、最も高いビットレートのみでの提案法の有効性を示すことができた。一方、他の7つのビットレートに対しては、提案法が適応できる見込みはあるものの、まだその検証は行われていない。これは時間的な余裕がなかったためであるが、Covid-19感染拡大と縮小に伴う、オンライン授業と対面授業のハイブリッド実施とその準備について、時間が割かれてしまったのが最大の原因である。
|
Strategy for Future Research Activity |
提案手法の有効性を、AMR符号化の複数のビットレートモードにおいて検証する。また、より現実的な音声符号化条件においても、検出性能を検証する。具体的には、音声信号に雑音が重畳された場合、秘匿情報量がより少なくなった場合、およびそれらの組み合わせに対して、検出側ではそれらの条件の変化を事前に知ることはできないため、全ての条件に対する学習後の単一識別モデルを用いる。また、ファイルの時間が短くなった場合の検出性能も検証する。 これらの新規に取り組む実験条件では、これまで行ってきた各条件ごとに識別モデルを学習する手法に比べて、検出性能が低下することが見込まれる。これに対して、偶数サブフレームのピッチデータヒストグラムに加えて、サブフレーム間のピッチ遷移確率も同時に機械学習することで、検出性能の向上を目指す。
|
Causes of Carryover |
Covid-19 感染拡大に伴い、国際学会および国内学会の研究発表会開催がオンラインとなり、これらの参加に伴う旅費交通費を全く支出しなかったため、次年度使用額が生じた。 次年度は、研究発表会が現地開催となる場合が増えることが見込まれており、その旅費交通費として支出すること、併せて数値演算言語(MATLAB)年間ライセンス料、論文データベース使用料、学会参加費、論文掲載料等で支出する計画である。
|