• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

音声合成法と話者適応技術および編集合成に基づく詐称音声の相対位相情報による検出法

Research Project

Project/Area Number 16K12461
Research InstitutionToyohashi University of Technology

Principal Investigator

中川 聖一  豊橋技術科学大学, リーディング大学院教育推進機構, 特任教授 (20115893)

Co-Investigator(Kenkyū-buntansha) 王 龍標  長岡技術科学大学, 工学研究科, 准教授 (30510458) [Withdrawn]
岩橋 政宏  長岡技術科学大学, 工学研究科, 教授 (30251854)
Project Period (FY) 2016-04-01 – 2019-03-31
Keywords話者照合 / 相対位相情報 / 詐称音声 / 再生音 / 振幅スペクトラム / 位相スペクトラム
Outline of Annual Research Achievements

我々は、話者が直接発声した音声と音声合成技術等によって合成された(詐称)音声を識別する技術を開発してきた。本年度は、我々が提案した相対位相情報を用いた識別手法をIEEE Transactionsに論文投稿し、修正後に採録になった。
また、雑音重畳により話者識別精度が劣化するため、雑音重畳音声の振幅スペクトラムと位相スペクトラムからクリーン音声の振幅スペクトラムと位相スペクトラムをディープネットワークを用いて復元する手法を提案した。これにより話者識別精度が改善できることを示した。
本研究の中心課題は、話者が直接発声した音声か録音再生した音声かを識別する手法を開発することである。これは世界的に注目されている課題であり、共通データベースを用いた評価ワークショップが計画されている。我々は共通データベースの入手が間に合わず、正式にワークショップに参加できる機会を逃したが、予備的な実験では、標準手法を上回る予想以上の結果を得ている。これをさらに改善する手法を考案した(これらはいずれも未発表)。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

我々が提案した相対位相情報が詐称音声に頑健で、話者照合に有効であることを示し、IEEE Transactionsに採録された。
また、話者が直接発声した音声か録音再生した音声かを識別する技術においても、予備実験ではあるが、高精度に識別できる見通しを得た。

Strategy for Future Research Activity

話者が直接発声した音声か録音再生音声かを高精度に識別する手法を開発する。
録音再生音は直接発声した音声と比べて、録音再生機の位相特性が変化することを利用する。但し、位相情報は話者によっても異なるので、これに対処する方法を考案する。
相対位相情報に、話者情報を表現するi-vectorを補助情報として併用して、直接発声した音声か録音再生音かを識別する手法を開発する。識別手法には、ガウス混合分布に基づく方法に換えて、ディープニューラルネットワークに基づく方法を使用する。

Causes of Carryover

分坦研究者が途中で交替し、それぞれの分坦者に配分したため、当初予定していた配分額よりも多く配分することになったが、代表者自身は、次年度の論文掲載料などを考慮して、次年度の予算を確保するように務めた。

Expenditure Plan for Carryover Budget

論文掲載料(2編のジャーナル論文)や国際会議論文校閲料に使用する。

  • Research Products

    (3 results)

All 2017 2016 Other

All Int'l Joint Research (1 results) Journal Article (1 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 1 results) Presentation (1 results) (of which Int'l Joint Research: 1 results)

  • [Int'l Joint Research] 天津大学(中国)

    • Country Name
      CHINA
    • Counterpart Institution
      天津大学
  • [Journal Article] Spoofing speech detection using modified relative phase information2017

    • Author(s)
      L. Wang, S. Nakagawa, Z. Zhang, Y. Yoshida, Y. Kawakami
    • Journal Title

      IEEE Journal of Selected Topics in Signal Processing

      Volume: 11 Pages: 660, 670

    • DOI

      10.1109/JSTSP.2017.2694139

    • Peer Reviewed / Int'l Joint Research
  • [Presentation] DNN-based amplitude and phase feature enhancement for noise robust speaker identification2016

    • Author(s)
      Z. Oo, Y. Kawakami, L. Wang, S. Nakagawa, X. Xiao, M. Iwahashi
    • Organizer
      Proc. Interspeech, ISCA
    • Place of Presentation
      サンフランシスコ、アメリカ
    • Year and Date
      2016-09-11
    • Int'l Joint Research

URL: 

Published: 2018-01-16   Modified: 2022-02-22  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi