研究課題/領域番号 |
16K12461
|
研究機関 | 豊橋技術科学大学 |
研究代表者 |
中川 聖一 豊橋技術科学大学, リーディング大学院教育推進機構, 特命教授 (20115893)
|
研究分担者 |
王 龍標 長岡技術科学大学, 工学研究科, 准教授 (30510458) [辞退]
岩橋 政宏 長岡技術科学大学, 工学研究科, 教授 (30251854)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 話者認識 / 相対位相情報 / 詐称音声 / 話者照合 / なりすまし音声 / 録音再生音 |
研究実績の概要 |
我々が提案した相対位相情報を、ある人の声になりすます詐称音声の識別に利用する研究を進めてきた。今までに、相対位相情報が、音声合成技術や音声変換技術により作成された詐称音声と原音声とを識別することに有用であることを示してきた。 本年度は、録音された音声をスピーカーを通して再生された音声と直接マイクに発声した音声との識別の評価実験を行った。相対位相情報は、伝達特性の影響を受けることが知られている。録音機器を介在するか否かの違いは伝達特性の違いとして現れるため、相対位相が有効な特徴量であることが予想された。 評価実験の結果、我々の提案する相対位相が、このような詐称音声に有効であることを示した。詳細に分析した結果、録音再生機器の性能が良ければ、録音再生機器を通した音声と原音声との識別が困難なこと、スマートフォンなどの録音再生機器の性能が悪い場合は、識別が容易なことも分かった。これは識別率が、伝達特性の変動量と大きな相関があるためである。単独特徴量としては、詐称音声の識別には相対位相が最も優れていることを示した。実際には、従来のメルケプストラム係数(MGCC)などと併用すると、さらに識別率は向上する。 本年度の位相情報の改良点として、従来は低周波数帯域~中周波数帯域の相対位相情報に限定してきたが、これを高周波数帯域まで拡張したこと、そのため、相対位相特徴をメルケプストラム領域に変換し、次元削減を行ったことである。これによっても、識別性能が向上した。 この他に、本年度は、相対位相情報が、従来のメルケプストラム係数と併用することにより、音声区間の検出にも有用であることを示した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
我々の提案している相対位相情報が、録音再生音声と直接音声(原音声)との識別に予想以上に有効であることを示した。詐称音声の識別に、単独特徴量としては、相対位相が最も優れていることを示した。 また、相対位相情報の抽出法を改善し、この有効性も示した。具体的には、従来は低周波数帯域から中周波数帯域で、相対位相情報を抽出していたのを、高周波数帯域まで拡大したこと、これによって増加する特徴量を低減するため、メル周波数ケプストラム係数に変換したことである。
|
今後の研究の推進方策 |
相対位相情報の更なる改善として、線形予測残差波形の相対位相情報の検討を行う。残差波形は、音源情報を近似的に表現しており、話者情報を多く含んでいると考えられる。従来の相対位相情報は、声道特性の影響も受けていたが、この影響が除去でき、識別性能を向上できる可能性がある。 しかし、伝達特性の違いは、声道特性の違いにも表れるため、総合的な識別のための判断が必要になり、このことも検討する。
|
次年度使用額が生じた理由 |
次年度(2018年度)に海外(インド)で研究成果の発表を予定しているため、旅費を確保した。また、海外(中国)の共同研究者との打ち合わせのため、外国出張を予定しているため、旅費を確保した。
|