2020 Fiscal Year Research-status Report
Blind detection of audio data hiding
Project/Area Number |
18K11301
|
Research Institution | Tokyo University of Information Sciences |
Principal Investigator |
西村 明 東京情報大学, 総合情報学部, 教授 (30286182)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | ステガナリシス / ステガノグラフィ / LSB / 線形予測 / 機械学習 / 時間周波数分析 / エントロピー |
Outline of Annual Research Achievements |
画像データ(JPEG, BMP)と音波形データ(WAV, AU)のLSB(最下位ビット)へ情報を秘匿する Steghide を採り上げ、音声波形データ(WAV)に対する情報秘匿の有無を、秘匿前波形データ無しで識別するステガナリシス手法を検討した。Steghide は、秘匿対象信号の振幅統計量をなるだけ変化させないように、秘匿対象サンプルの最下位ビット値が秘匿ビット値となるような、最も値の近いサンプルと交換することで秘匿を行う。このため、秘匿対象音データ全体の振幅統計量はほぼ変化しないが、短い区間ごとに分割すると、その区間での振幅分布には偏りが生じる。これを手掛かりとして、微小区間ごとの情報量を特徴量とするような秘匿の識別を試みた。その結果、これまで情報秘匿の有無を識別できなかった一部の音響信号では、有効に識別できることが分かった一方で、識別性能は音響信号の波形振幅分布に大きく影響を受けることも明らかになり、全体として識別率の向上には至らなかった。さらに、2020年度中に新たに発表されたSteghideによる情報秘匿を識別する手法を実装し、性能比較を行うことを試みた。しかし、米国における新型コロナウィルス蔓延のためLDC(Linguistic Data Consortium)の活動が低下しており、使用する音声信号データベースを入手することができなかった。 また、代表的音声符号化手法であるCELP方式において、そのピッチディレイ値への量子符号化によって情報が秘匿されたことの識別については、新型コロナウィルス感染防止のための学内教育活動、および研究指導活動が多忙を極めたため、取り組むことができなかった。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
新型コロナウィルス感染防止のための学内活動が多忙を極めたため、継続的に本研究に取り組むことができなかった。
|
Strategy for Future Research Activity |
Steghide による情報秘匿の識別には、音響信号の特性に応じた複数の音響特徴量および統計量が有効であることを、これまでの実験データは示している。これらの音響特徴量および統計量を統合して識別学習するような機械学習手法を構築する。 また、代表的音声符号化手法であるCELP方式には、そのピッチディレイ値への量子符号化によって情報を秘匿する手法が考案されており、秘匿に伴う音質劣化も少ないことが分かっているが、ピッチディレイ値に量子化に伴う統計量の変化が現れる。これを検出するステガナリシス手法が提案されているが、背景に雑音を含むような音声が符号化される場合には、秘匿が無い場合でも秘匿ありと同様な統計量の変化が現れることが分かっており、識別が困難となる。この問題を再符号化時のピッチディレイ値の統計量の変化により識別する手法に取り組む。さらに、識別性能を高めるために、深層ニューラルネットおよび畳み込みニューラルネットを機械学習として導入する。
|
Causes of Carryover |
COVID-19 感染防止のための学内教育および研究指導が多忙を極め、本研究に継続的に取り組む時間的余裕がなかった。また、研究に必要なデータ等の購入も、米国におけるCOVID-19蔓延により完了できなかった。さらに、国際会議および国内研究発表会等は全てオンラインで行われたため、旅費交通費の支出が抑えられた。これらによって、次年度使用額が生じた。 使用計画としては、オンラインで開催される情報秘匿を主な議題とする国際会議(6月IHMMSec、10月IWDW、11月IIHMSP)を聴講することで、旅費交通費をかけずに最新の研究情報を参考にすること、識別アルゴリズムの可能性を高めるための畳み込みニューラルネットによる機械学習を高速に実行するためのグラフィクスボードを追加購入すること、様々な判別のための機械学習が可能なソフトウェアシステム(SPSS)を導入すること、を計画している。
|