• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実績報告書

メディアクローン攻撃を防御するための聴覚メディア信号処理基盤の構築

研究課題

研究課題/領域番号 17H01761
研究機関北陸先端科学技術大学院大学

研究代表者

鵜木 祐史  北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (00343187)

研究分担者 赤木 正人  北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (20242571)
研究期間 (年度) 2017-04-01 – 2021-03-31
キーワード聴覚メディア信号処理 / メディアクローン / 音声合成技術 / 聴覚センシング / 音響情報ハイディング / 音響電子透かし
研究実績の概要

本年度(最終年度)は,音声のメディアクローン生成・認識法を深く理解するために,VAEとStarGANを利用して,音声の話者性と発話内容を切り分けて制御可能な音声変換法を提案した.音声変換の総合評価の結果,提案法は,VQ-VAE法といった従来法よりも,高い音質を保持しつつ,音声の話者性と発話内容の変換に対して有効であることがわかった.これらの結果から,音声のメディアクローンを作成する際,音声スペクトル包絡線情報と音源情報の時間変動が重要な音響的特徴であることがわかった.
次に,人が発した音声なのか,あるいはメディアクローンなのかを判断するために,重要な音響的特徴を検討した.その結果,音声の子音部分や無音区間における音響的特徴の差異を利用できることがわかった.
次に,音響的特徴に知覚不可能で頑健な秘匿情報を埋め込む仕組みを検討した.ここでは,メディアクローン攻撃や音声改ざん等を防ぐための情報ハイディング法として,線形予測法(LP)をベースとした音声分析合成系におけるスペクトル拡散型音声情報ハイディング法や,ロバスト主成分分析法(RPCA)とフォルマント強調法を組み合わせた音声情報ハイディング法を実現した.また,CELP音声分析合成系において,スペクトル包絡線情報の一つである線スペクトル周波数LSFに量子化変調(QIM)することで情報ハイディングする方法も実現した.
最後に,両方法を利用したハイブリッド型の音声改ざん検出法も検討した.これらの方法が,典型的な改ざん攻撃に対して耐性があることを確認した.また,話者性を秘匿するAnonymization技術への応用についても検討した.これらが音声のメディアクローン検出に重要な技術に成り得ることを確認した.

現在までの達成度 (段落)

令和2年度が最終年度であるため、記入しない。

今後の研究の推進方策

令和2年度が最終年度であるため、記入しない。

備考

Science Impact Construction of auditory media signal processing infrastructure to prevent media clone attacks
https://www.ingentaconnect.com/content/sil/impact/2020/00002020/00000002/art00008

  • 研究成果

    (12件)

すべて 2021 2020

すべて 雑誌論文 (9件) (うち査読あり 7件、 オープンアクセス 3件) 学会発表 (3件)

  • [雑誌論文] Evolving Multi-Resolution Pooling CNN for Monaural Singing Voice Separation2021

    • 著者名/発表者名
      Yuan Weitao、Dong Bofei、Wang Shengbei、Unoki Masashi、Wang Wenwu
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      巻: 29 ページ: 807~822

    • DOI

      10.1109/TASLP.2021.3051331

    • 査読あり / オープンアクセス
  • [雑誌論文] Cross-Lingual Voice Conversion With Controllable Speaker Individuality Using Variational Autoencoder and Star Generative Adversarial Network2021

    • 著者名/発表者名
      Ho Tuan Vu、Akagi Masato
    • 雑誌名

      IEEE Access

      巻: 9 ページ: 47503~47515

    • DOI

      10.1109/ACCESS.2021.3063519

    • 査読あり / オープンアクセス
  • [雑誌論文] 音声メディアへの情報ハイディングとその応用2021

    • 著者名/発表者名
      鵜木祐史
    • 雑誌名

      日本音響学会誌

      巻: 77(6) ページ: -

  • [雑誌論文] Synchronous multi-bit audio watermarking based on phase shifting2021

    • 著者名/発表者名
      Shengbei Wang, Weitao Yuan, Zhen Zhang, Jianming Wang, Masashi Unoki
    • 雑誌名

      Proc. ICASSP2021

      巻: - ページ: -

    • 査読あり
  • [雑誌論文] Multi-Subspace Echo Hiding Based on Time-Frequency Similarities of Audio Signals2020

    • 著者名/発表者名
      Wang Shengbei、Yuan Weitao、Unoki Masashi
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      巻: 28 ページ: 2349~2363

    • DOI

      10.1109/TASLP.2020.3013785

    • 査読あり / オープンアクセス
  • [雑誌論文] Audio Information Hiding Techniques Based on Human Auditory Characteristics2020

    • 著者名/発表者名
      UNOKI Masashi
    • 雑誌名

      IEICE ESS Fundamentals Review

      巻: 13 ページ: 284~293

    • DOI

      10.1587/essfr.13.4_284

  • [雑誌論文] X-Vector Singular Value Modification and Statistical-Based Decomposition with Ensemble Regression Modeling for Speaker Anonymization System2020

    • 著者名/発表者名
      Mawalim Candy Olivia、Galajit Kasorn、Karnjana Jessada、Unoki Masashi
    • 雑誌名

      Proc. Interspeech2020

      巻: - ページ: 1703-1707

    • 査読あり
  • [雑誌論文] Non-parallel Voice Conversion based on Hierarchical Latent Embedding Vector Quantized Variational Autoencoder2020

    • 著者名/発表者名
      Tuan Vu Ho and Masato Akagi
    • 雑誌名

      Joint Workshop for the Blizzard Challenge and Voice Conversion Challenge 2020

      巻: - ページ: 140-144

    • 査読あり
  • [雑誌論文] Speech Information Hiding by Modification of LSF Quantization Index in CELP Codec2020

    • 著者名/発表者名
      Candy Olivia Mawalim, Shengbei Wang, Masashi Unoki
    • 雑誌名

      Proc. APSIPA2020

      巻: - ページ: 1321-1330

    • 査読あり
  • [学会発表] Audio Information Hiding in Sub-signals by deploying Singular Spectrum Analysis and Psychoacoustic Model2021

    • 著者名/発表者名
      Kasorn Galajit, Jessada Karnjana, Masashi Unoki
    • 学会等名
      IEICE Technical Report, EMM2020-61
  • [学会発表] X-vector anonymization using regression modeling with statistical and singular value2021

    • 著者名/発表者名
      Candy Olivia Mawalim, Kasorn Galajit, Jessada Karnjana, Masashi Unoki
    • 学会等名
      IEICE Technical Report, EMM2020-62
  • [学会発表] 線形予測残差を用いたスペクトル拡散型音声情報ハイディング法の検討2021

    • 著者名/発表者名
      鵜木祐史, ウィン ラ ピャエ,
    • 学会等名
      IEICE Technical Report, EMM2020-63

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi