研究課題
今年度は、合成音声と人間の音声の識別に焦点をあてた。まずは、昨年のキャラクター識別実験で、キャラクター内距離と話者内距離が顕著に異なることが示されたことから、同一単語発話の比較による合成音声識別について検証した。合成音声を比較したときの距離は、一般に、人間の音声を比較したときよりも小さい。人間の音声に対しては、読み上げ発話のほかに、自然発話を対象とした実験も行い、自然発話は読み上げ発話よりも距離が大きくなる傾向を確認した。同一音韻を対象とした同様の実験も行ったところ、比較する単語の音韻数が少なくなると識別性能が低下する傾向が見られた。また、単語内の繰り返し発話「もしもし」の前後を比較してみたが、判断は難しいことも分かった。今回対象としたメーカー,バージョンの異なる音声合成ソフトウェア18種,89キャラクターのうち、78キャラクターの合成音声が識別できたが、ソフトウェア1種についての識別は困難だった。人工音声による話者認識器詐称実験では、昨年のi-vectorに代わり、近年、話者認識器の主流となっているDNNを用いた話者認識器ResNetに対する同様の詐称調査を行い、ResNetがi-vectorより人工音声に詐称されにくいことが示された。その他、音声波形の位相ひずみを可視化し、目視による識別を試みた結果、人間の音声に比べて合成音声では、位相ひずみの見ためは崩れ、フォルマントとの対応も弱くなり、合成音声によっては発話中の音の変化に伴った様子すら現れないなど、人間の音声とは大きく異なることが認められた。さらに、話者認識の精度向上を目的とした話者埋め込み手法の改良やi-vectorを用いた話者認識についての予備実験を行い、有効性を確認した。また、法科学的利用を想定した周波数帯域を指定する話者比較について、オーストラリア国立大学の研究者との共同研究も継続した。
令和3年度が最終年度であるため、記入しない。
すべて 2022 2021 その他
すべて 国際共同研究 (1件) 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 1件) 学会発表 (9件)
Smart Innovation, Systems and Technologies
巻: - ページ: -
Acoustical Science and Technology
巻: 42 ページ: 150-153
10.1250/ast.42.150