• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実績報告書

メディアクローン攻撃を防御するための聴覚メディア信号処理基盤の構築

研究課題

研究課題/領域番号 17H01761
研究機関北陸先端科学技術大学院大学

研究代表者

鵜木 祐史  北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (00343187)

研究分担者 赤木 正人  北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (20242571)
研究期間 (年度) 2017-04-01 – 2021-03-31
キーワード聴覚メディア信号処理 / メディアクローン / 音声合成技術 / 聴覚センシング / 音響情報ハイディング / 音響電子透かし
研究実績の概要

実世界の真正データから限りなく本物に近いものとして人工的に作られたメディアは「メディアクローン」と呼ばれる.近年,このメディアクローンが実世界やサイバー空間で流通され,社会的脅威となりつつある.特に,音声合成技術を駆使して産み出された本物そっくりな音声は,「なりすまし」や「改ざん」に悪用され,音声認証システムを突破するなど重大な社会問題を巻き起こしつつある.本研究の目的は,音信号のメディアクローン攻撃に対して,適切な防御策(なりすましや改ざんの検出)を実現するための聴覚メディア信号処理の基盤技術を確立することである.
本年度は,前年度に引き続き,音声のメディアクローン生成・認識法を深く理解し,具体的な攻撃方法を模擬検討した.ここでは,Variational Autoencoder (VAE)を利用して,音声の話者性と発話内容を切り分けて制御可能な音声変換法を提案した.音声変換の総合評価の結果,音声の自然性にまだ若干の問題が残るものの,提案法が,GMM法やonehot-VAE法といった従来法よりも,音声の話者性と発話内容の変換に対して有効であることがわかった.次に,音声改ざん等を防ぐための情報ハイディング法として,線形予測法(LP)をベースとした音声分析合成系におけるスペクトル拡散型音声情報ハイディング法とロバスト主成分分析法とフォルマント強調方を組み合わせた音声情報ハイディング法を実現した.また,両方法を利用したハイブリッド型の音声改ざん検出法も検討した.これらの方法が,典型的な改ざん攻撃に対して耐性があることを確認した.最後に,メディアクローンで利用される重要な音響的特徴を検討した.ここでは聴覚マスキング特性を加味したSpikegramの他に,人が発した音声なのか,あるいはそのメディアクローンなのか,音声の子音部分や無音区間における音響的特徴の差異を検討した.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

研究期間では,音声のメディアクローンの生成・認識法を深く理解した上で,次の三つの課題に取り組むことを計画していた.(1) 音声のメディアクローンを作成する際,何が最も重要な音響的特徴であるかを明らかにする.(2) ヒトが発する音と機械が発する音の音響的特徴の差異を明らかにする.(3) 音響特徴に知覚不可能で頑健な秘匿情報を埋め込む仕組むをつくる.
当該年度では,昨年度から継続して,これら三つの課題に取り組んだ.課題(1)では,代表的な機械学習(Variational Autoencoder)を利用して,音声の発話内容と話者性を切り分けて音声変換可能な方法を実現した.また,この声質変換法を利用して,なりすましの一つとして音声変換が可能であることも確認した.次に課題(2)では,まだ検討中の部分が多いが,人が発する音声の子音にみられる音響特徴がメディアクローンの判別に利用可能であることを突き止めた.しかし,この音響特徴は背景音に埋もれると検出が難しくなるなどの課題を残したため,今後,ロバスト検出法を検討する予定である.最後に課題(3)では,音声情報で重要な特徴(音源や声道フィルタ特性)や聴覚的特徴(マスキング特性や知覚的スペクトル形状)に秘匿情報を埋め込む仕組みを検討した.以上から,当初の計画通りに実施できていると判断できる.

今後の研究の推進方策

令和元年度の取り組みから,ヒトが発する声(音声だけでなく口唇や舌,鼻腔からでる人体雑音)と機械が発する音(例えば,AD/DA変換から生じる微小な定常的雑音やジッター・シマーのようなヒトには知覚できない位相変化をもつ音)の音響的特徴に違いがあることがわかった.特に,音声の子音(破裂音)によるバズ音特有の特徴(バズバーなど)が音声のメディアクローンでは見られないなど,いくつかの重要な発見があった.令和2年度は,これらの特徴を利用した音声電子指紋を検討したのち,音響的特徴に知覚不可能で頑健な秘匿情報の埋め込み・検出を可能とする聴覚的な情報ハイディング法を確立する.最後に,最終年度に向け,メディアクローンの検出のための,図(目的音)の秘匿情報と地(背景音)の音響電子指紋の検出方法について検討していくことで,研究の大きな前進を目指す.

備考

Construction of auditory media signal processing infrastructure to prevent media clone attacks

  • 研究成果

    (14件)

すべて 2020 2019 その他

すべて 雑誌論文 (7件) (うち国際共著 4件、 査読あり 7件、 オープンアクセス 5件) 学会発表 (6件) (うち国際学会 3件、 招待講演 1件) 備考 (1件)

  • [雑誌論文] Non-Blind Speech Watermarking Method Based on Spread-Spectrum Using Linear Prediction Residue2020

    • 著者名/発表者名
      Reiya Namikawa and Masashi Unoki
    • 雑誌名

      IEICE Transactions on Information and Systems

      巻: E103.D ページ: 63~66

    • DOI

      https://doi.org/10.1587/transinf.2019MUL0003

    • 査読あり / オープンアクセス
  • [雑誌論文] 聴覚特性に基づいた音響情報ハイディング技術2020

    • 著者名/発表者名
      鵜木祐史
    • 雑誌名

      IEICE ESS Fundamentals Review

      巻: 13 ページ: 284~293

    • DOI

      https://doi.org/10.1587/essfr.13.4_284

    • 査読あり / オープンアクセス
  • [雑誌論文] Speech Watermarking Based on Source-filter Model of Speech Production2019

    • 著者名/発表者名
      Shengbei Wang, Weitao Yuan, Jianming Wang, and Masashi Unoki
    • 雑誌名

      Journal of Information Hiding and Multimedia Signal Processing

      巻: 10(14) ページ: 517-534

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Detection of speech tampering using sparse representations and spectral manipulations based information hiding2019

    • 著者名/発表者名
      Shengbei, Wang, Weitao, Yuan, Jianming, Wang, and Masashi Unoki
    • 雑誌名

      Speech Communication

      巻: 112 ページ: 1~14

    • DOI

      https://doi.org/10.1016/j.specom.2019.06.004

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Feasibility of Audio Information Hiding Using Linear Time Variant IIR Filters Based on Cochlear Delay2019

    • 著者名/発表者名
      Candy Olivia Mawalim and Masashi Unoki
    • 雑誌名

      Journal of Signal Processing

      巻: 23 ページ: 155~158

    • DOI

      https://doi.org/10.2299/jsp.23.155

    • 査読あり / オープンアクセス
  • [雑誌論文] Data Augmentation for Monaural Singing Voice Separation Based on Variational Autoencoder-Generative Adversarial Network2019

    • 著者名/発表者名
      Boxin He, Shengbei Wang, Weitao Yuan, Jianming Wang, and Masashi Masashi
    • 雑誌名

      Proc. ICME2019

      巻: - ページ: 1354-1359

    • DOI

      10.1109/ICME.2019.00235

    • 査読あり / 国際共著
  • [雑誌論文] Inaudible Speech Watermarking Based on Self-compensated Echo-hiding and Sparse Subspace Clustering2019

    • 著者名/発表者名
      Shengbei Wang, Weitao Yuan, Jianming Wang, and Masashi Unoki
    • 雑誌名

      Proc. ICASSP2019

      巻: - ページ: 2632-2636

    • DOI

      10.1109/ICASSP.2019.8682352

    • 査読あり / 国際共著
  • [学会発表] Speech communication with affective speech-to-speech translation2019

    • 著者名/発表者名
      Masato Akagi
    • 学会等名
      National Conference on Man-Machine Speech Communication (NCMMSC2019)
    • 国際学会 / 招待講演
  • [学会発表] Audio Information Hiding based on Cochlear Delay Characteristics with Optimized Segment Selection2019

    • 著者名/発表者名
      Candy Olivia Mawalim and Masashi Unoki
    • 学会等名
      2019 3rd International Conference on Security with Intelligent Computing and Big-data Services (SICBS 2019)
    • 国際学会
  • [学会発表] Non-parallel Voice Conversion with Controllable Speaker Individuality using Variational Autoencoder2019

    • 著者名/発表者名
      Tuan Vu Ho and Masato Akagi
    • 学会等名
      APSIPA2019
    • 国際学会
  • [学会発表] Cochlear delay based audio information hiding with segment selection optimization2019

    • 著者名/発表者名
      Candy Olivia Mawalim and Masashi Unoki
    • 学会等名
      電子情報通信学会EMM研究会,東北大学
  • [学会発表] Study on cochlear-delay based audio information hiding by linear time-variant IIR filter2019

    • 著者名/発表者名
      Candy Olivia Mawalim and Masashi Unoki
    • 学会等名
      日本音響学会2019年度秋季研究発表会,立命館大学
  • [学会発表] 蝸牛遅延に基づいた線形時変IIRフィルタによる音響情報ハイディング2019

    • 著者名/発表者名
      キャンディ オリフィア マワリム,鵜木祐史
    • 学会等名
      2019年度電気・情報関係学会北陸支部連合大会, 石川高専
  • [備考] Science Impact

    • URL

      https://www.ingentaconnect.com/content/sil/impact/2020/00002020/00000002/art00008

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi