2021 Fiscal Year Annual Research Report
Detection of synthetic voice and character identification for estimation of products.
Project/Area Number |
18H01671
|
Research Institution | National Research Institute of Police Science |
Principal Investigator |
長内 隆 科学警察研究所, 法科学第四部, 部長 (70392264)
|
Co-Investigator(Kenkyū-buntansha) |
黒岩 眞吾 千葉大学, 大学院工学研究院, 教授 (20333510)
柘植 覚 大同大学, 情報学部, 教授 (00325250)
鎌田 敏明 科学警察研究所, 法科学第四部, 室長 (10356173)
蒔苗 久則 科学警察研究所, 法科学第四部, 主任研究官 (20415441)
網野 加苗 科学警察研究所, 法科学第四部, 主任研究官 (70630698)
岡田 昌大 科学警察研究所, 法科学第四部, 研究員 (80874502)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | 音声合成 / 話者認識 / 犯罪捜査支援 / 機械学習 / 音声学 / 位相ひずみ |
Outline of Annual Research Achievements |
今年度は、合成音声と人間の音声の識別に焦点をあてた。まずは、昨年のキャラクター識別実験で、キャラクター内距離と話者内距離が顕著に異なることが示されたことから、同一単語発話の比較による合成音声識別について検証した。合成音声を比較したときの距離は、一般に、人間の音声を比較したときよりも小さい。人間の音声に対しては、読み上げ発話のほかに、自然発話を対象とした実験も行い、自然発話は読み上げ発話よりも距離が大きくなる傾向を確認した。同一音韻を対象とした同様の実験も行ったところ、比較する単語の音韻数が少なくなると識別性能が低下する傾向が見られた。また、単語内の繰り返し発話「もしもし」の前後を比較してみたが、判断は難しいことも分かった。今回対象としたメーカー,バージョンの異なる音声合成ソフトウェア18種,89キャラクターのうち、78キャラクターの合成音声が識別できたが、ソフトウェア1種についての識別は困難だった。 人工音声による話者認識器詐称実験では、昨年のi-vectorに代わり、近年、話者認識器の主流となっているDNNを用いた話者認識器ResNetに対する同様の詐称調査を行い、ResNetがi-vectorより人工音声に詐称されにくいことが示された。 その他、音声波形の位相ひずみを可視化し、目視による識別を試みた結果、人間の音声に比べて合成音声では、位相ひずみの見ためは崩れ、フォルマントとの対応も弱くなり、合成音声によっては発話中の音の変化に伴った様子すら現れないなど、人間の音声とは大きく異なることが認められた。 さらに、話者認識の精度向上を目的とした話者埋め込み手法の改良やi-vectorを用いた話者認識についての予備実験を行い、有効性を確認した。また、法科学的利用を想定した周波数帯域を指定する話者比較について、オーストラリア国立大学の研究者との共同研究も継続した。
|
Research Progress Status |
令和3年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和3年度が最終年度であるため、記入しない。
|
Research Products
(12 results)