• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実績報告書

合成音声の検知と製品推定のためのキャラクター識別

研究課題

研究課題/領域番号 18H01671
研究機関科学警察研究所

研究代表者

長内 隆  科学警察研究所, 法科学第四部, 部長 (70392264)

研究分担者 黒岩 眞吾  千葉大学, 大学院工学研究院, 教授 (20333510)
鎌田 敏明  科学警察研究所, 法科学第四部, 室長 (10356173)
蒔苗 久則  科学警察研究所, 法科学第四部, 主任研究官 (20415441)
網野 加苗  科学警察研究所, 法科学第四部, 主任研究官 (70630698)
柘植 覚  大同大学, 情報学部, 教授 (00325250)
研究期間 (年度) 2018-04-01 – 2022-03-31
キーワード音声合成 / 話者認識 / 犯罪捜査支援 / 機械学習 / 音声学
研究実績の概要

(1)合成音声と人間の音声の識別:識別可能な音響特徴量について網羅的に調査を行ったところ、発話時における声門からの息漏れに結びつけて考えられている声質である“気息性”に関連する音響特徴量ケプストラル・ピーク卓越度(cepstral peak prominence: CPP)で合成音声と人間の音声に差異が認められた。合成音声のCPPの分布は、人間の音声と比べて、双峰化の傾向を示すこと、時間変動が大きいことが示唆された。合成音声の場合、話速やピッチの条件を変えることで発話変動を与えることができるが、人間の音声の話者内変動に比べて、大きく変化しないことが示された。また、合成音声及び声質変換音声コーパスを構築し、それらを用いて話者認識実験を行った結果、合成音声や声質変換音声では誤認識が誘発され、特に、声質変換音声のほうが合成音声より識別が難しいことがわかった。その他、法科学的利用を想定した周波数帯域を指定する比較方法について豪州の研究者と共同研究を引き続き行った。
(2)合成音声のキャラクター識別:整備した音声合成ソフトウェアを用いて合成音声データベースの構築を開始した。我々が以前構築した多数話者音声データベースや多言語音声コーパスとの整合性を考慮し、同一発話による合成音声の生成を行った。話速、声の高さ、イントネーションなど種々の条件設定はアプリケーションごとに可能な設定で作成した。まだキャラクター数は少ないので、引き続き生成する。話者認識実験では、予備的ではあるが、動的計画法を用いたテキスト依存型において、肉声による話者認識と同等かそれ以上の認識性能が得られることを確認した。さらに、現在、主流の話者認識手法であるi-vector及び、d-vector、x-vectorを用いたテキスト独立型による話者認識システムの構築のための文献調査などを行った。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

i-vectorを用いた話者認識についての実験並びにシステム構築を検討していたが、認識システム構築に必要となる計算機の整備に遅滞が生じた。また、合成音声の長時間にわたる特徴として、“気息性”に関連する音響特徴量であるケプストラル・ピーク卓越度(cepstral peak prominence: CPP)について先に着目したため、息継ぎの検知までは検討できなかった。しかし、合成音声の識別に、息遣いに関連する特徴の有効性を示すことができたと考える。なお、合成音声が犯罪利用されるケースを想定すると、電話利用が主となると考えられる。その場合、音質の劣化が見込まれ、息使いに関連する特徴検出が困難になることが予想されるので、音質劣化時の対応についての検討も必要と考える。

今後の研究の推進方策

(1)合成音声と人間の音声の識別:合成音声は、声の高さ、速さなどを調整できるものもあるが、人間の発話に比べると、その変動は小さいことを示した。さらに、発話スタイルの違いに由来する話者内変動の単語、音韻依存性について調査する。また、自然性の高い合成音声であっても、その音声を聴取すると、所々、違和感を覚えるフレーズが散見される。そこで、発話リズムなどに着目し、違和感を与える要因を調査する。あわせて、研究協力者として、北海道科捜研の秋田氏の協力を得て、時間領域に含まれる個人性情報の抽出を試みる。そのほか、部分空間法による合成音声の識別などについても検討する計画である。
(2)合成音声のキャラクター識別:これまでに整備した音声合成アプリケーションを用いて、キャラクターごとの合成音声データベースの拡張を図る。構築にあたっては、当所ですでに構築した多数話者音声データベースやJNASなどのコーパスに基づいた発話を選定し、さらに声の高さ、速さなどを調整して構築する。テキスト依存型、テキスト独立型の話者認識実験を実施し、キャラクター識別性能の比較、さらには、アプリケーション識別の可能性について検証する。なお、機械学習の利用にあっては、研究協力者として、科警研の岡田氏の協力を得る。音韻による識別性能に差異が生じるとしたら、どのようなフレーズを用いることが効果的かについても調べる。

  • 研究成果

    (10件)

すべて 2019 その他

すべて 国際共同研究 (1件) 学会発表 (9件) (うち国際学会 1件)

  • [国際共同研究] オーストラリア国立大学(オーストラリア)

    • 国名
      オーストラリア
    • 外国機関名
      オーストラリア国立大学
  • [学会発表] 合成音声と人間の音声の気息性の差異に関する予備的検討2019

    • 著者名/発表者名
      長内 隆,網野 加苗,蒔苗 久則,鎌田 敏明
    • 学会等名
      日本法科学技術学会 第25回学術集会
  • [学会発表] アクセントに現れる地域方言と話者の地域属性の関係2019

    • 著者名/発表者名
      網野 加苗,蒔苗 久則,鎌田 敏明,長内 隆
    • 学会等名
      日本法科学技術学会 第25回学術集会
  • [学会発表] ブログ筆者の地域性推定手法の評価実験2019

    • 著者名/発表者名
      蒔苗 久則,網野 加苗,鎌田 敏明,長内 隆
    • 学会等名
      日本法科学技術学会 第25回学術集会
  • [学会発表] 動的区間のフォルマント周波数の個人性に関する予備的分析2019

    • 著者名/発表者名
      鎌田 敏明,蒔苗 久則,網野 加苗,長内 隆
    • 学会等名
      日本法科学技術学会 第25回学術集会
  • [学会発表] 偽装音声としての裏声と通常発声の音響的判別2019

    • 著者名/発表者名
      網野 加苗、荒井 隆行、庄野 槙
    • 学会等名
      日本音響学会2019年秋季研究発表会
  • [学会発表] 二者同時発話を対象としたテキスト依存話者照合2019

    • 著者名/発表者名
      鵜川 敏行、堀内 靖雄、黒岩 眞吾
    • 学会等名
      日本音響学会2019年秋季研究発表会
  • [学会発表] 誤嚥防止に向けた声道内残留物による音響特徴量変化の分析2019

    • 著者名/発表者名
      細山 友紀、西村 雅史、西田 昌史、堀内 靖雄、黒岩 眞吾
    • 学会等名
      日本音響学会2019年秋季研究発表会
  • [学会発表] DNNを用いた生体音声と合成音声の識別2019

    • 著者名/発表者名
      佐口巧城
    • 学会等名
      電気学会東京支部主催 第10回学生研究発表会
    • 国際学会
  • [学会発表] Artificial Speech Corpus in Japanese for Anti-spoofing Automatic Speaker Recognition2019

    • 著者名/発表者名
      Satoru Tsuge, Shingo Kuroiwa
    • 学会等名
      Intelligent Interactive Multimedia Systems and Services (KES-IIMSS-19)

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi