2016 Fiscal Year Research-status Report
音声合成法と話者適応技術および編集合成に基づく詐称音声の相対位相情報による検出法
Project/Area Number |
16K12461
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
中川 聖一 豊橋技術科学大学, リーディング大学院教育推進機構, 特任教授 (20115893)
|
Co-Investigator(Kenkyū-buntansha) |
王 龍標 長岡技術科学大学, 工学研究科, 准教授 (30510458) [Withdrawn]
岩橋 政宏 長岡技術科学大学, 工学研究科, 教授 (30251854)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 話者照合 / 相対位相情報 / 詐称音声 / 再生音 / 振幅スペクトラム / 位相スペクトラム |
Outline of Annual Research Achievements |
我々は、話者が直接発声した音声と音声合成技術等によって合成された(詐称)音声を識別する技術を開発してきた。本年度は、我々が提案した相対位相情報を用いた識別手法をIEEE Transactionsに論文投稿し、修正後に採録になった。 また、雑音重畳により話者識別精度が劣化するため、雑音重畳音声の振幅スペクトラムと位相スペクトラムからクリーン音声の振幅スペクトラムと位相スペクトラムをディープネットワークを用いて復元する手法を提案した。これにより話者識別精度が改善できることを示した。 本研究の中心課題は、話者が直接発声した音声か録音再生した音声かを識別する手法を開発することである。これは世界的に注目されている課題であり、共通データベースを用いた評価ワークショップが計画されている。我々は共通データベースの入手が間に合わず、正式にワークショップに参加できる機会を逃したが、予備的な実験では、標準手法を上回る予想以上の結果を得ている。これをさらに改善する手法を考案した(これらはいずれも未発表)。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
我々が提案した相対位相情報が詐称音声に頑健で、話者照合に有効であることを示し、IEEE Transactionsに採録された。 また、話者が直接発声した音声か録音再生した音声かを識別する技術においても、予備実験ではあるが、高精度に識別できる見通しを得た。
|
Strategy for Future Research Activity |
話者が直接発声した音声か録音再生音声かを高精度に識別する手法を開発する。 録音再生音は直接発声した音声と比べて、録音再生機の位相特性が変化することを利用する。但し、位相情報は話者によっても異なるので、これに対処する方法を考案する。 相対位相情報に、話者情報を表現するi-vectorを補助情報として併用して、直接発声した音声か録音再生音かを識別する手法を開発する。識別手法には、ガウス混合分布に基づく方法に換えて、ディープニューラルネットワークに基づく方法を使用する。
|
Causes of Carryover |
分坦研究者が途中で交替し、それぞれの分坦者に配分したため、当初予定していた配分額よりも多く配分することになったが、代表者自身は、次年度の論文掲載料などを考慮して、次年度の予算を確保するように務めた。
|
Expenditure Plan for Carryover Budget |
論文掲載料(2編のジャーナル論文)や国際会議論文校閲料に使用する。
|
Research Products
(3 results)