• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Annual Research Report

プライバシー情報を隠蔽するための音声処理に関する研究

Research Project

Project/Area Number 21700192
Research InstitutionToyohashi University of Technology

Principal Investigator

山本 一公  豊橋技術科学大学, 大学院・工学研究科, 助教 (40324230)

Keywordsプライバシー保護 / センサ情報 / 音声信号処理 / 遠隔発話音声 / 音源分離 / 非負値行列因子分解 / 話者認識 / 残響除去
Research Abstract

公共の場で収録される音・音声情報が有効に活用できる場面は多いと考えられるが、プライバシーの問題を感じる人が多いため、現在のところあまり利用されていない。本研究では、音・音声情報から、プライバシー情報(話者を推定し得る情報)を隠蔽することを目的として、音信号から音声・背景音を分離することでプライバシーを保護する「音声除去」、音声信号を別人の音声に変えることでプライバシーを保護する「声質変換」、音声認識することで言語的なプライバシー情報を保護する技術について検討を進めてきた。
音信号から音声と背景音を分離するためには、ネット上の音声が収録済みの音声・背景音混合音声であることから、シングルチャネルで音声と背景雑音を分離する技術が必要である。これまではベクトル量子化(VQ)に基づく手法であったが、昨年度非負値行列因子分解(NMF)を導入し、性能の向上を図った。今年度は更に、音声認識においてNMFとVQを併用(認識尤度の線型結合)による音声認識性能の改善を行った。また、NMFは行列の分解に要する計算量が多く、実用的なアプリケーションでは用いにくいため、NMFの高速化についても検討を行った。具体的には、音声と背景音のデータベースから、NMFの基底だけでなく代表ベクトルに対する重みも同時に事前に算出しておき、入力ベクトルに最もマッチする代表ベクトルの重みを用いてフィルタを構成する。これにより、リアルタイム処理が可能となった。
また、プライバシーを保護するためには誰が喋っているかを知る必要があるため、実環境下話者認識の性能改善を行った。本年度は、残響環境下音声に対して、過去の数フレームから現在の残響音響特徴を予測できると仮定した線形予測モデルの逆フィルタ処理による残響除去を試みた。これにより、残響音響下での話者認識性能の向上を得た。

  • Research Products

    (6 results)

All 2012 2011

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (5 results)

  • [Journal Article] CENSREC-4 : An evaluation framework for distant-talking speech recognition in reverberant environments2011

    • Author(s)
      T.Fukumori, T.Nishiura, M.Nakayama, Y.Denda, N.Kitaoka, T.Yamada, K.Yamamoto, 他10名
    • Journal Title

      Acoustical Science and Technology

      Volume: 32 Pages: 201-210

    • DOI

      10.1250/ast.32.201

    • Peer Reviewed
  • [Presentation] 音楽重畳音声の音声認識のためのNMFによる音楽除去の高速化およびVQ手法の改善2012

    • Author(s)
      仲野翔一, 山本一公, 中川聖一
    • Organizer
      日本音響学会2012年春季研究発表会
    • Place of Presentation
      神奈川大学(横浜市)
    • Year and Date
      2012-03-13
  • [Presentation] 残響に頑健な遠隔発話の話者認識の検討2012

    • Author(s)
      嶋田晃太, 山本一公, 中川聖一
    • Organizer
      日本音響学会2012年春季研究発表会
    • Place of Presentation
      神奈川大学(横浜市)
    • Year and Date
      2012-03-13
  • [Presentation] Speaker identification using pseudo pitch synchronized phase information in voiced sound2011

    • Author(s)
      Kohta Shimada, Kazumasa Yamamoto, Seiichi Nakagawa
    • Organizer
      2011 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference
    • Place of Presentation
      西安(中国)
    • Year and Date
      2011-10-20
  • [Presentation] Speech recognition in mixed sound of speech and music based on vector quantization and non-negative matrix factorization2011

    • Author(s)
      Shoichi Nakano, Kazumasa Yamamoto, Seiichi Nakagawa
    • Organizer
      INTERSPEECH 2011
    • Place of Presentation
      フィレンツェ(イタリア)
    • Year and Date
      2011-08-29
  • [Presentation] NMFとVQ手法による音楽重畳音声の音声認識2011

    • Author(s)
      仲野翔一, 山本一公, 中川聖一
    • Organizer
      電子情報通信学会・日本音響学会音声研究会
    • Place of Presentation
      名古屋大学(名古屋市)
    • Year and Date
      2011-06-23

URL: 

Published: 2013-06-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi