音声を中心とした２話者混在メディア加工手法に関する実験的検討

Research Project

Project/Area Number	19K12058
Research Category	Grant-in-Aid for Scientific Research (C)
Allocation Type	Multi-year Fund
Section	一般
Review Section	Basic Section 61010:Perceptual information processing-related
Research Institution	Gunma National College of Technology
Principal Investigator	川本真一群馬工業高等専門学校, 電子情報工学科, 准教授 (70418507)
Project Period (FY)	2019-04-01 – 2025-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000) Fiscal Year 2021: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000) Fiscal Year 2020: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000) Fiscal Year 2019: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Keywords	話者混合 / 音声モーフィング / 話者性
Outline of Research at the Start	本研究課題では，「二人の声の特徴を部分的に混ぜ合わせての１つの声を作り出したとき，混ぜ合わせた元の話者の特徴が感じられるようにすることはできるか？」という問いに対して，実験を通じて検討を進める．これにより，ある話者の声の特徴や印象を残しつつ，一部の特徴を別話者の声に近づける方略について模索する．
Outline of Annual Research Achievements	本研究課題は，二人の音声から抽出した特徴を混ぜることにより作成した音声の中に，混ぜた二人の話者の情報がどのように知覚されるかを実験的に検討するものである．この手段として，音声を特徴量レベルで混合する「音声モーフィング」という技術を利用した．現時点で扱う特徴量としては，主にスペクトル包絡情報の加工に焦点を当てて検討を進めた．本研究課題では特に，音声モーフィングにおけるスペクトル包絡情報を，「フォルマント周波数とその周辺のスペクトル包絡上の特徴点を補間した平滑化スペクトル」と「元のスペクトル包絡と平滑化スペクトルとの差分で表現する差分スペクトル」とに分け，それぞれに独立して音声モーフィングにおける混合重みを設定して加工した音声刺激に対して，どのように話者の情報が知覚されるかについて検討を進めている．当該年度では主に，スペクトル歪み量を基準として２話者のスペクトルを混合する複数の混合条件下での刺激音声合成を試みた。しかし、刺激数や混合話者の組み合わせ数などの条件を考慮したとき、現時点では現実的な規模での実験を設計するに至っていない。一方で、並行して本研究課題で扱う個人を知覚する情報から着想を得て、個人差を検知するための知見の収集及び応用の検討も始めている。今後は，実験結果の信頼性確保に向けて，実験に使用するデータの拡充および追加の聴取実験を進めていくことと並行して、本研究テーマの扱う話題の周辺分野への応用・拡張についても検討を進める予定である．
Current Status of Research Progress	Current Status of Research Progress 3: Progress in research has been slightly delayed. Reason 現時点では，音声加工の検討及びその結果を用いたモーフィング音声の聴取印象に関する予備検討まではできているが，実験協力者の確保や実験実施が思うように設定できず，評価が十分に進められていない．
Strategy for Future Research Activity	引き続き，実験を注意深く積み重ねることで評価データの収集を進め，結果の分析を進めることと並行して、本研究テーマの扱う話題の周辺分野への応用・拡張についても検討を進める．

Report

(5 results)

Research Products
(5 results)

All 2023 2021 2020

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (3 results)

[Journal Article] Speaker Verification Based on Synchronous Speech and Video Features2023
- Author(s)
  Hiroto Nakajima, Shinichi Kawamoto
- Journal Title
  
  2023 IEEE 12th Global Conference on Consumer Electronics (GCCE)
  
  Volume: - Pages: 413-414
- DOI
  10.1109/gcce59613.2023.10315388
- Related Report
  2023 Research-status Report
- Peer Reviewed
[Journal Article] Voice Morphing with Smoothed Spectrum Subtraction for Voice Manipulation2021
- Author(s)
  Kobayashi Natsumi、Kawamoto Shin-Ichi
- Journal Title
  
  Proceedings of GCCE2021
  
  Volume: - Pages: 379-380
- DOI
  10.1109/gcce53005.2021.9621771
- Related Report
  2021 Research-status Report
- Peer Reviewed
[Presentation] 二話者混合音声の知覚に関する検討2020
- Author(s)
  小林夏美,川本真一
- Organizer
  令和元年度北陸地区学生による研究発表会
- Related Report
  2019 Research-status Report
[Presentation] キャラクタ演技音声における知覚的話者空間の検討2020
- Author(s)
  藤田圭,川本真一
- Organizer
  令和元年度北陸地区学生による研究発表会
- Related Report
  2019 Research-status Report
[Presentation] 主観年齢予測におけるモーフィング音声によるデータ拡充法の検討2020
- Author(s)
  生方亮壮,川本真一
- Organizer
  令和元年度北陸地区学生による研究発表会
- Related Report
  2019 Research-status Report

音声を中心とした２話者混在メディア加工手法に関する実験的検討

Principal Investigator

川本 真一 群馬工業高等専門学校, 電子情報工学科, 准教授 (70418507)

¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)

Current Status of Research Progress

Reason

Report

Research Products

[Journal Article] Speaker Verification Based on Synchronous Speech and Video Features2023

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Voice Morphing with Smoothed Spectrum Subtraction for Voice Manipulation2021

Author(s)

Journal Title

DOI

Related Report

[Presentation] 二話者混合音声の知覚に関する検討2020

Author(s)

Organizer

Related Report

[Presentation] キャラクタ演技音声における知覚的話者空間の検討2020

Author(s)

Organizer

Related Report

[Presentation] 主観年齢予測におけるモーフィング音声によるデータ拡充法の検討2020

Author(s)

Organizer

Related Report

川本真一群馬工業高等専門学校, 電子情報工学科, 准教授 (70418507)