2020 年度実績報告書

合成音声の検知と製品推定のためのキャラクター識別

研究課題

研究課題/領域番号	18H01671
研究機関	科学警察研究所
研究代表者	長内隆科学警察研究所, 法科学第四部, 部長 (70392264)
研究分担者	黒岩眞吾千葉大学, 大学院工学研究院, 教授 (20333510) 柘植覚大同大学, 情報学部, 教授 (00325250) 鎌田敏明科学警察研究所, 法科学第四部, 室長 (10356173) 蒔苗久則科学警察研究所, 法科学第四部, 主任研究官 (20415441) 網野加苗科学警察研究所, 法科学第四部, 主任研究官 (70630698)
研究期間 (年度)	2018-04-01 – 2022-03-31
キーワード	音声合成 / 話者認識 / 犯罪捜査支援 / 機械学習 / 音声学
研究実績の概要	（１）合成音声と人間の音声の識別：発話スタイルとして裏声に着目した。裏声の録音（男性15名、女性9名）を行い、通常発声との違いを分析した結果、基本周波数、調波構造に違いが見られた。さらに、裏声と通常発声の発話を用いて話者識別知覚実験を行い、裏声同士でも話者の違いが知覚できることを確認した。また合成音声モデル構築に用いたオリジナル録音音声と合成した音声について、基本周波数や発話タイミングを比較するための文献調査を行った。音響学会新聞読み上げコーパス(JNAS)に対する合成音声判別実験を行い、i-vectorを入力としたDNNによる実音声・合成音声判別実験の結果、合成音声作成方法が既知の場合には十分に判別可能であることを確認した。その他、オーストラリア国立大学の研究者と行っている法科学的利用を想定した周波数帯域を指定する話者比較についての研究も継続している。これは合成音声と人間の音声の違いを周波数帯域毎に調査する際に利用できると考えている。（２）合成音声のキャラクター識別：単語音声を用い、動的計画法によるテキスト依存型キャラクター識別実験を行った。各アプリケーションで生成する標準音声を登録資料、生成条件を変えて生成した複数の音声を入力資料とした実験１と登録、入力資料を入れ替えた実験２を行った。同様の条件となるように設定した人間の音声による話者識別結果と比較したところ、合成音声によるキャラクター識別率は人間の音声よりも高くなった。特に様々な条件下で生成した複数の合成音声を登録資料とした実験２のほうが顕著であった。これは合成音声の変動は人間の音声と比べると小さいためと考えられた。また、JNASに対する合成音声を、Sproket、OpenJTalk、Yukarinの３種類で作成し、それらが入力された場合の話者認識をi-vectorベースで行い、合成音声の話者認識詐称率を求めた。
現在までの達成度 (区分)	現在までの達成度 (区分) 3: やや遅れている理由新型コロナウイルス感染防止のため、幾度となく緊急事態宣言が発出され、出勤制限せざるを得なくなった。あわせてオンライン授業、オンライン会議の導入など従来することの無かった対応も生じ、結果として、研究時間の確保が困難となっている。そのため当初計画通りの実施に支障をきたす恐れがある。例えば、合成音声のキャラクター識別では、今年度、キャラクター識別実験は行えたもののアプリケーション識別まではまだ実施できていない。一方、研究分担者、研究協力者の追加により、当初計画にはなかった深層学習の利用や発話リズムに関する研究に着手できるようになった。自然性の高い合成音声であっても、その音声を聴取すると違和感を覚えるフレーズが散見されることから、発話リズムに着目し、違和感を与える要因の調査が今年度の計画であったが、まだ分析途中であるため、引き続き検証を行うこととする。
今後の研究の推進方策	（１）合成音声と人間の音声の識別：話者認識分野ではDNNによる話者埋め込み手法が広く研究されている。この手法を用いて合成音声と人間の音声の識別に挑戦する。一般に、話者ベクトル空間における距離から同一話者か否かを判断するが、合成音声では人間の音声と比べて距離が近すぎることになるのではと予想している。また話者内変動という観点からも合成音声と人間の音声の両者には違いが現れると考えられるので更なる検討を行う。自然性の高い合成音声であっても違和感を覚えるフレーズが散見されることから、合成音声の基本周波数、発話タイミングなど時間領域に含まれる情報に着目した分析を行ってきたが、分析途中であるため、分析を継続する。なお、発話リズムの違いについては、引き続き北海道科捜研の秋田氏を研究協力者として研究を進める。（２）合成音声のキャラクター識別：これまでにアプリケーション16種、キャラクター数81種による単文、単語、音韻の音声を合成し、この一部を利用して研究を行ってきた。さらにアプリケーション2種、キャラクター数8種を追加し、これらによって生成した合成音声データを、キャラクター、発声内容、生成条件で分類した合成音声データベースの構築を進める。テキスト依存型キャラクター識別を実施したが、さらにアプリケーション識別が可能であることが考えられたので取り組む計画である。また未知の合成音声から合成音声生成の条件（速さ、声の高さなど）を推定できるか否かについても検討する。また、これまでJNASに対する合成音声を生成し、合成音声の話者認識詐称率を求めてきたが、別の合成音声生成手法を追加して同様の検討を行う。科警研の岡田氏を研究分担者に加え、スペクトログラムの再配置法（reassignment）を応用した話者識別やキャラクター識別についても着手する予定である。

研究成果
(13件)

すべて 2021 2020 その他

すべて国際共同研究 (1件) 雑誌論文 (3件) (うち査読あり 3件、オープンアクセス 1件) 学会発表 (9件)

[国際共同研究] オーストラリア国立大学(オーストラリア)
- 国名
  オーストラリア
- 外国機関名
  オーストラリア国立大学
[雑誌論文] Auditory speaker discrimination using modal and falsetto speech2021
- 著者名/発表者名
  Amino Kanae, Shono Maki, Arai Takayuki
- 雑誌名
  
  Acoustical Science and Technology
  
  巻: 42 ページ: 62～64
- DOI
  10.1250/ast.42.62
- 査読あり / オープンアクセス
[雑誌論文] Analysis of Acoustic Features Affected by Residual Food in the Piriform Fossa Toward Early-Detection of Dysphagia2020
- 著者名/発表者名
  Tomoki Hosoyama, Masahiro Koto, Masafumi Nishimura, Masafumi Nishida, Yasuo Horiuchi, Shingo Kuroiwa
- 雑誌名
  
  Innovation in Medicine and Healthcare
  
  巻: 192 ページ: 171～177
- DOI
  10.1007/978-981-15-5852-8_16
- 査読あり
[雑誌論文] Text-Dependent Closed-Set Two-Speaker Recognition of a Key Phrase Uttered Synchronously by Two Persons2020
- 著者名/発表者名
  Ugawa Toshiyuki, Tsuge Satoru, Horiuchi Yasuo, Kuroiwa Shingo
- 雑誌名
  
  Proceedings of KES-HCIS 2020 Conference
  
  巻: 189 ページ: 405～413
- DOI
  10.1007/978-981-15-5784-2_33
- 査読あり
[学会発表] 合成音声によるテキスト依存型キャラクター識別2020
- 著者名/発表者名
  長内隆, 網野加苗, 蒔苗久則, 岡田昌大, 鎌田敏明
- 学会等名
  日本法科学技術学会第26回学術集会
[学会発表] 発話モードが異なる音声における韻律の話者内一貫性2020
- 著者名/発表者名
  網野加苗, 岡田昌大, 蒔苗久則, 鎌田敏明, 長内隆
- 学会等名
  日本法科学技術学会第26回学術集会
[学会発表] 話者の異同識別における韻律の有効性に関する研究2020
- 著者名/発表者名
  秋田仁也, 岡田昌大, 網野加苗, 蒔苗久則, 鎌田敏明, 長内隆
- 学会等名
  日本法科学技術学会第26回学術集会
[学会発表] 動的区間の母音特徴量の個人性に関する予備的分析2020
- 著者名/発表者名
  鎌田敏明, 蒔苗久則, 網野加苗, 岡田昌大, 長内隆
- 学会等名
  日本法科学技術学会第26回学術集会
[学会発表] 録音レベル調整のための文節音の音量調査2020
- 著者名/発表者名
  岡田昌大, 網野加苗, 蒔苗久則, 鎌田敏明, 長内隆
- 学会等名
  日本法科学技術学会第26回学術集会
[学会発表] ブログ筆者の地域性推定に用いる言語形態の最適化による性能の改善2020
- 著者名/発表者名
  蒔苗久則, 網野加苗, 岡田昌大, 鎌田敏明, 長内隆
- 学会等名
  日本法科学技術学会第26回学術集会
[学会発表] 歌声を用いた話者照合システムの検討2020
- 著者名/発表者名
  森山結衣，堀内靖雄，黒岩眞吾
- 学会等名
  電子情報通信学会HCGシンポジウム2020
[学会発表] 誤嚥防止に向けた梨状窩への食物残留模擬音声の分析2020
- 著者名/発表者名
  細山友紀，杉田あおい，西村雅史，西田昌史，堀内靖雄，黒岩眞吾
- 学会等名
  電子情報通信学会総合大会
[学会発表] 発声スタイルの違いによる母音の話者内分散の変化2020
- 著者名/発表者名
  杉田あおい，細山友紀，西村雅史，西田昌史，堀内靖雄，黒岩眞吾
- 学会等名
  電子情報通信学会総合大会

2020 年度 実績報告書

合成音声の検知と製品推定のためのキャラクター識別

研究代表者

長内 隆 科学警察研究所, 法科学第四部, 部長 (70392264)

現在までの達成度 (区分)

理由

研究成果

[国際共同研究] オーストラリア国立大学(オーストラリア)

国名

外国機関名

[雑誌論文] Auditory speaker discrimination using modal and falsetto speech2021

著者名/発表者名

雑誌名

DOI

[雑誌論文] Analysis of Acoustic Features Affected by Residual Food in the Piriform Fossa Toward Early-Detection of Dysphagia2020

著者名/発表者名

雑誌名

DOI

[雑誌論文] Text-Dependent Closed-Set Two-Speaker Recognition of a Key Phrase Uttered Synchronously by Two Persons2020

著者名/発表者名

雑誌名

DOI

[学会発表] 合成音声によるテキスト依存型キャラクター識別2020

著者名/発表者名

学会等名

[学会発表] 発話モードが異なる音声における韻律の話者内一貫性2020

著者名/発表者名

学会等名

[学会発表] 話者の異同識別における韻律の有効性に関する研究2020

著者名/発表者名

学会等名

[学会発表] 動的区間の母音特徴量の個人性に関する予備的分析2020

著者名/発表者名

学会等名

[学会発表] 録音レベル調整のための文節音の音量調査2020

著者名/発表者名

学会等名

[学会発表] ブログ筆者の地域性推定に用いる言語形態の最適化による性能の改善2020

著者名/発表者名

学会等名

[学会発表] 歌声を用いた話者照合システムの検討2020

著者名/発表者名

学会等名

[学会発表] 誤嚥防止に向けた梨状窩への食物残留模擬音声の分析2020

著者名/発表者名

学会等名

[学会発表] 発声スタイルの違いによる母音の話者内分散の変化2020

著者名/発表者名

学会等名

2020 年度実績報告書

長内隆科学警察研究所, 法科学第四部, 部長 (70392264)