• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Detection of synthetic voice and character identification for estimation of products.

Research Project

Project/Area Number 18H01671
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeSingle-year Grants
Section一般
Review Section Basic Section 25020:Safety engineering-related
Research InstitutionNational Research Institute of Police Science

Principal Investigator

長内 隆  科学警察研究所, 法科学第四部, 部長 (70392264)

Co-Investigator(Kenkyū-buntansha) 黒岩 眞吾  千葉大学, 大学院工学研究院, 教授 (20333510)
柘植 覚  大同大学, 情報学部, 教授 (00325250)
鎌田 敏明  科学警察研究所, 法科学第四部, 室長 (10356173)
蒔苗 久則  科学警察研究所, 法科学第四部, 主任研究官 (20415441)
網野 加苗  科学警察研究所, 法科学第四部, 主任研究官 (70630698)
Project Period (FY) 2018-04-01 – 2022-03-31
Project Status Granted (Fiscal Year 2020)
Budget Amount *help
¥17,290,000 (Direct Cost: ¥13,300,000、Indirect Cost: ¥3,990,000)
Fiscal Year 2020: ¥2,990,000 (Direct Cost: ¥2,300,000、Indirect Cost: ¥690,000)
Fiscal Year 2019: ¥2,990,000 (Direct Cost: ¥2,300,000、Indirect Cost: ¥690,000)
Fiscal Year 2018: ¥8,320,000 (Direct Cost: ¥6,400,000、Indirect Cost: ¥1,920,000)
Keywords音声合成 / 話者認識 / 犯罪捜査支援 / 機械学習 / 音声学
Outline of Annual Research Achievements

(1)合成音声と人間の音声の識別:識別可能な音響特徴量について網羅的に調査を行ったところ、発話時における声門からの息漏れに結びつけて考えられている声質である“気息性”に関連する音響特徴量ケプストラル・ピーク卓越度(cepstral peak prominence: CPP)で合成音声と人間の音声に差異が認められた。合成音声のCPPの分布は、人間の音声と比べて、双峰化の傾向を示すこと、時間変動が大きいことが示唆された。合成音声の場合、話速やピッチの条件を変えることで発話変動を与えることができるが、人間の音声の話者内変動に比べて、大きく変化しないことが示された。また、合成音声及び声質変換音声コーパスを構築し、それらを用いて話者認識実験を行った結果、合成音声や声質変換音声では誤認識が誘発され、特に、声質変換音声のほうが合成音声より識別が難しいことがわかった。その他、法科学的利用を想定した周波数帯域を指定する比較方法について豪州の研究者と共同研究を引き続き行った。
(2)合成音声のキャラクター識別:整備した音声合成ソフトウェアを用いて合成音声データベースの構築を開始した。我々が以前構築した多数話者音声データベースや多言語音声コーパスとの整合性を考慮し、同一発話による合成音声の生成を行った。話速、声の高さ、イントネーションなど種々の条件設定はアプリケーションごとに可能な設定で作成した。まだキャラクター数は少ないので、引き続き生成する。話者認識実験では、予備的ではあるが、動的計画法を用いたテキスト依存型において、肉声による話者認識と同等かそれ以上の認識性能が得られることを確認した。さらに、現在、主流の話者認識手法であるi-vector及び、d-vector、x-vectorを用いたテキスト独立型による話者認識システムの構築のための文献調査などを行った。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

i-vectorを用いた話者認識についての実験並びにシステム構築を検討していたが、認識システム構築に必要となる計算機の整備に遅滞が生じた。また、合成音声の長時間にわたる特徴として、“気息性”に関連する音響特徴量であるケプストラル・ピーク卓越度(cepstral peak prominence: CPP)について先に着目したため、息継ぎの検知までは検討できなかった。しかし、合成音声の識別に、息遣いに関連する特徴の有効性を示すことができたと考える。なお、合成音声が犯罪利用されるケースを想定すると、電話利用が主となると考えられる。その場合、音質の劣化が見込まれ、息使いに関連する特徴検出が困難になることが予想されるので、音質劣化時の対応についての検討も必要と考える。

Strategy for Future Research Activity

(1)合成音声と人間の音声の識別:合成音声は、声の高さ、速さなどを調整できるものもあるが、人間の発話に比べると、その変動は小さいことを示した。さらに、発話スタイルの違いに由来する話者内変動の単語、音韻依存性について調査する。また、自然性の高い合成音声であっても、その音声を聴取すると、所々、違和感を覚えるフレーズが散見される。そこで、発話リズムなどに着目し、違和感を与える要因を調査する。あわせて、研究協力者として、北海道科捜研の秋田氏の協力を得て、時間領域に含まれる個人性情報の抽出を試みる。そのほか、部分空間法による合成音声の識別などについても検討する計画である。
(2)合成音声のキャラクター識別:これまでに整備した音声合成アプリケーションを用いて、キャラクターごとの合成音声データベースの拡張を図る。構築にあたっては、当所ですでに構築した多数話者音声データベースやJNASなどのコーパスに基づいた発話を選定し、さらに声の高さ、速さなどを調整して構築する。テキスト依存型、テキスト独立型の話者認識実験を実施し、キャラクター識別性能の比較、さらには、アプリケーション識別の可能性について検証する。なお、機械学習の利用にあっては、研究協力者として、科警研の岡田氏の協力を得る。音韻による識別性能に差異が生じるとしたら、どのようなフレーズを用いることが効果的かについても調べる。

Report

(2 results)
  • 2019 Annual Research Report
  • 2018 Annual Research Report

Research Products

(21 results)

All 2019 2018 Other

All Int'l Joint Research Journal Article Presentation

  • [Int'l Joint Research] オーストラリア国立大学(オーストラリア)

    • Related Report
      2019 Annual Research Report
  • [Int'l Joint Research] オーストラリア国立大学(オーストラリア)

    • Related Report
      2018 Annual Research Report
  • [Journal Article] トランペット演奏における個人性を表す音響的特徴の分析2019

    • Author(s)
      丸山翔太郎,黒岩眞吾,堀内靖雄
    • Journal Title

      電子情報通信学会論文誌A

      Volume: J102-A Pages: 120-123

    • Related Report
      2018 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Bone- and air-conduction speech combination method for speaker recognition2019

    • Author(s)
      Tsuge Satoru、Kuroiwa Shingo
    • Journal Title

      International Journal of Biometrics

      Volume: 11 Pages: 35-35

    • DOI

      10.1504/ijbm.2019.096565

    • Related Report
      2018 Annual Research Report
    • Peer Reviewed
  • [Presentation] 合成音声と人間の音声の気息性の差異に関する予備的検討2019

    • Author(s)
      長内 隆,網野 加苗,蒔苗 久則,鎌田 敏明
    • Organizer
      日本法科学技術学会 第25回学術集会
    • Related Report
      2019 Annual Research Report
  • [Presentation] アクセントに現れる地域方言と話者の地域属性の関係2019

    • Author(s)
      網野 加苗,蒔苗 久則,鎌田 敏明,長内 隆
    • Organizer
      日本法科学技術学会 第25回学術集会
    • Related Report
      2019 Annual Research Report
  • [Presentation] ブログ筆者の地域性推定手法の評価実験2019

    • Author(s)
      蒔苗 久則,網野 加苗,鎌田 敏明,長内 隆
    • Organizer
      日本法科学技術学会 第25回学術集会
    • Related Report
      2019 Annual Research Report
  • [Presentation] 動的区間のフォルマント周波数の個人性に関する予備的分析2019

    • Author(s)
      鎌田 敏明,蒔苗 久則,網野 加苗,長内 隆
    • Organizer
      日本法科学技術学会 第25回学術集会
    • Related Report
      2019 Annual Research Report
  • [Presentation] 偽装音声としての裏声と通常発声の音響的判別2019

    • Author(s)
      網野 加苗、荒井 隆行、庄野 槙
    • Organizer
      日本音響学会2019年秋季研究発表会
    • Related Report
      2019 Annual Research Report
  • [Presentation] 二者同時発話を対象としたテキスト依存話者照合2019

    • Author(s)
      鵜川 敏行、堀内 靖雄、黒岩 眞吾
    • Organizer
      日本音響学会2019年秋季研究発表会
    • Related Report
      2019 Annual Research Report
  • [Presentation] 誤嚥防止に向けた声道内残留物による音響特徴量変化の分析2019

    • Author(s)
      細山 友紀、西村 雅史、西田 昌史、堀内 靖雄、黒岩 眞吾
    • Organizer
      日本音響学会2019年秋季研究発表会
    • Related Report
      2019 Annual Research Report
  • [Presentation] DNNを用いた生体音声と合成音声の識別2019

    • Author(s)
      佐口巧城
    • Organizer
      電気学会東京支部主催 第10回学生研究発表会
    • Related Report
      2019 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Artificial Speech Corpus in Japanese for Anti-spoofing Automatic Speaker Recognition2019

    • Author(s)
      Satoru Tsuge, Shingo Kuroiwa
    • Organizer
      Intelligent Interactive Multimedia Systems and Services (KES-IIMSS-19)
    • Related Report
      2019 Annual Research Report
  • [Presentation] 時期差のある単語発話を用いた話者照合における標準化・正規化変換の効果2018

    • Author(s)
      長内 隆,網野 加苗,蒔苗 久則,鎌田 敏明
    • Organizer
      日本法科学技術学会 第24回学術集会
    • Related Report
      2018 Annual Research Report
  • [Presentation] i-vector を用いた話者照合における発話長の影響2018

    • Author(s)
      中村 裕之,新井 隆浩,上田 篤,蒔苗 久則,長内 隆,大塚 敏
    • Organizer
      日本法科学技術学会 第24回学術集会
    • Related Report
      2018 Annual Research Report
  • [Presentation] 言語形態を用いた地域性推定における共通語形の影響2018

    • Author(s)
      網野 加苗,蒔苗 久則,鎌田 敏明,長内 隆
    • Organizer
      日本法科学技術学会 第24回学術集会
    • Related Report
      2018 Annual Research Report
  • [Presentation] Exploring sub-band cepstral distances for more robust speaker classification2018

    • Author(s)
      Takashi Osanai, Yuko Kinoshita, Frantz Clermont
    • Organizer
      17th Australasian International Conferenceon Speech Science and Technology
    • Related Report
      2018 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Forensic voice comparison using sub-band cepstral distances as features: A first attempt with vowels from 306 Japanese speakers under channel mismatch conditions2018

    • Author(s)
      Yuko Kinoshita, Takashi Osanai, Frantz Clermont
    • Organizer
      17th Australasian International Conferenceon Speech Science and Technology
    • Related Report
      2018 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Speaker Recognition in Orthogonal Complement of Time Session Variability Subspace2018

    • Author(s)
      Satoru Tsuge, Shingo Kuroiwa
    • Organizer
      KES International Conference on Intelligent Interactive Multimedia Systems and Services
    • Related Report
      2018 Annual Research Report
    • Int'l Joint Research
  • [Presentation] AWA Long-Term Recorded Speech Corpus and Robust Speaker Recognition Method for Session Variability2018

    • Author(s)
      Satoru Tsuge, Shingo Kuroiwa, Tomoko Ohsuga, Yuichi Ishimoto
    • Organizer
      Oriental COCOSDA 2018
    • Related Report
      2018 Annual Research Report
    • Int'l Joint Research
  • [Presentation] 聴取者が音声から受け取る感情を認識する手法の検討2018

    • Author(s)
      柴尾一成, 指導教員:黒岩眞吾
    • Organizer
      電気学会東京支部主催 第9回学生研究発表会
    • Related Report
      2018 Annual Research Report

URL: 

Published: 2018-04-23   Modified: 2021-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi