• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

音声を中心とした2話者混在メディア加工手法に関する実験的検討

研究課題

研究課題/領域番号 19K12058
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分61010:知覚情報処理関連
研究機関群馬工業高等専門学校

研究代表者

川本 真一  群馬工業高等専門学校, 電子情報工学科, 准教授 (70418507)

研究期間 (年度) 2019-04-01 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2021年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2020年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2019年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
キーワード話者混合 / 音声モーフィング / 話者性
研究開始時の研究の概要

本研究課題では,「二人の声の特徴を部分的に混ぜ合わせての1つの声を作り出したとき,混ぜ合わせた元の話者の特徴が感じられるようにすることはできるか?」という問いに対して,実験を通じて検討を進める.これにより,ある話者の声の特徴や印象を残しつつ,一部の特徴を別話者の声に近づける方略について模索する.

研究実績の概要

本研究課題は,二人の音声から抽出した特徴を混ぜることにより作成した音声の中に,混ぜた二人の話者の情報がどのように知覚されるかを実験的に検討するものである.この手段として,音声を特徴量レベルで混合する「音声モーフィング」という技術を利用した.現時点で扱う特徴量としては,主にスペクトル包絡情報の加工に焦点を当てて検討を進めた.
本研究課題では特に,音声モーフィングにおけるスペクトル包絡情報を,「フォルマント周波数とその周辺のスペクトル包絡上の特徴点を補間した平滑化スペクトル」と「元のスペクトル包絡と平滑化スペクトルとの差分で表現する差分スペクトル」とに分け,それぞれに独立して音声モーフィングにおける混合重みを設定して加工した音声刺激に対して,どのように話者の情報が知覚されるかについて検討を進めている.
当該年度では主に,スペクトル歪み量を基準として2話者のスペクトルを混合する複数の混合条件下での刺激音声合成を試みた。しかし、刺激数や混合話者の組み合わせ数などの条件を考慮したとき、現時点では現実的な規模での実験を設計するに至っていない。一方で、並行して本研究課題で扱う個人を知覚する情報から着想を得て、個人差を検知するための知見の収集及び応用の検討も始めている。
今後は,実験結果の信頼性確保に向けて,実験に使用するデータの拡充および追加の聴取実験を進めていくことと並行して、本研究テーマの扱う話題の周辺分野への応用・拡張についても検討を進める予定である.

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

現時点では,音声加工の検討及びその結果を用いたモーフィング音声の聴取印象に関する予備検討まではできているが,実験協力者の確保や実験実施が思うように設定できず,評価が十分に進められていない.

今後の研究の推進方策

引き続き,実験を注意深く積み重ねることで評価データの収集を進め,結果の分析を進めることと並行して、本研究テーマの扱う話題の周辺分野への応用・拡張についても検討を進める.

報告書

(5件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 2021 実施状況報告書
  • 2020 実施状況報告書
  • 2019 実施状況報告書
  • 研究成果

    (5件)

すべて 2023 2021 2020

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (3件)

  • [雑誌論文] Speaker Verification Based on Synchronous Speech and Video Features2023

    • 著者名/発表者名
      Hiroto Nakajima, Shinichi Kawamoto
    • 雑誌名

      2023 IEEE 12th Global Conference on Consumer Electronics (GCCE)

      巻: - ページ: 413-414

    • DOI

      10.1109/gcce59613.2023.10315388

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [雑誌論文] Voice Morphing with Smoothed Spectrum Subtraction for Voice Manipulation2021

    • 著者名/発表者名
      Kobayashi Natsumi、Kawamoto Shin-Ichi
    • 雑誌名

      Proceedings of GCCE2021

      巻: - ページ: 379-380

    • DOI

      10.1109/gcce53005.2021.9621771

    • 関連する報告書
      2021 実施状況報告書
    • 査読あり
  • [学会発表] 二話者混合音声の知覚に関する検討2020

    • 著者名/発表者名
      小林夏美,川本真一
    • 学会等名
      令和元年度 北陸地区学生による研究発表会
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] キャラクタ演技音声における知覚的話者空間の検討2020

    • 著者名/発表者名
      藤田圭,川本真一
    • 学会等名
      令和元年度 北陸地区学生による研究発表会
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] 主観年齢予測におけるモーフィング音声によるデータ拡充法の検討2020

    • 著者名/発表者名
      生方亮壮,川本真一
    • 学会等名
      令和元年度 北陸地区学生による研究発表会
    • 関連する報告書
      2019 実施状況報告書

URL: 

公開日: 2019-04-18   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi