ビスポーク音声デザインの骨格形成と体系化

研究課題

研究課題/領域番号	21H04900
研究種目	基盤研究(A)
配分区分	補助金
応募区分	一般
審査区分	中区分61:人間情報学およびその関連分野
研究機関	明治大学
研究代表者	森勢将雅明治大学, 総合数理学部, 専任教授 (60510013)
研究分担者	田中章浩東京女子大学, 現代教養学部, 教授 (80396530) 齋藤大輔東京大学, 大学院工学系研究科(工学部), 准教授 (40615150) 高道慎之介慶應義塾大学, 理工学部(矢上), 准教授 (90784330)
研究期間 (年度)	2021-04-05 – 2025-03-31
研究課題ステータス	交付 (2024年度)
配分額 *注記	42,770千円 (直接経費: 32,900千円、間接経費: 9,870千円) 2024年度: 4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円) 2023年度: 6,370千円 (直接経費: 4,900千円、間接経費: 1,470千円) 2022年度: 11,050千円 (直接経費: 8,500千円、間接経費: 2,550千円) 2021年度: 20,670千円 (直接経費: 15,900千円、間接経費: 4,770千円)
キーワード	音声・歌声情報処理 / 音声デザイン / 声質変換 / 音声知覚 / 音声情報処理 / 音声合成
研究開始時の研究の概要	最先端のテキスト音声合成は人間とほぼ等価な音声を合成可能であり，すでにスマートスピーカなどで利用されている．一方，同じテキストでも状況により表現を柔軟に加工できる技術は，主にコンテンツ制作の領域において需要がある．本研究は，音声合成研究の新たな方向性として，計算機があたかも職人のようにユーザと共同し，ユーザの音声デザインを助ける技術開発を目指す．心理学分野と連携し，テキスト音声合成や声質変換に適した音声制御のための心理パラメータを明らかにする．ユーザが大まかにデザインした結果を計算機が微調整し，自然な音声を合成する一連の技術を「ビスポーク音声デザイン」として体系化することが狙いである．
研究実績の概要	2023年度は，ビスポーク音声デザインのプロトタイプとして，点ピッチの考え方に基づき，モーラ単位でピッチ情報粗く制御できつつ自然な音声を生成可能なDNN音声合成を実装した．ピッチ制御についてはピッチ軌跡そのものをデザインすることも可能であるが，「ビスポーク」的なデザイン法として，ユーザーは大雑把なピッチ情報のみ与えることを重視している．合成音声の品質と目的のイントネーションを再現できるかについて主観評価を実施し，提案する方法が既存の方法よりも高い性能であることを確認した．次いで，音声デザインインタフェースの検討として，音声の分析からサポートするGUIについて検討を進めた．このGUIは，音声研究の専門家に向けて全てのパラメータを細かくチューニングできるものではなく，音声加工の初心者が試行錯誤的にピッチなどを加工できることをコンセプトとしている．様々な環境で多くの被験者に対する利用実績とフィードバックに基づいて改良を加えたものを暫定的なインタフェースとして採用した．本GUIについては学術論文として採録された．最後に，新たな音声評価法について検討した．現時点での音声合成の音質評価では，多くの論文でMOS (mean opinion score)が採用されている．MOSによる主観評価では音質差の検出力が低いため，特に合成音声の品質向上が著しく昨今では膨大な被験者数に基づく評価事例が増えつつあり，評価にかかるコストが増大している．そこで本課題では，新たに高品質な合成音声に対し，MOSよりも少人数で差の検出が可能な方法を提案した．同じ音声群を用いた評価をMOSと提案法とで実施し，同人数の評価結果であれば提案法のほうが差をより顕著に検出できることを確認した．上記が代表的な成果であるが，合成音声，音声コーパス作成，声質変換，音声知覚実験に関する成果報告も多数実施してきた．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由目標とする音声デザインの技術的な課題について，ピッチ情報について最低限の条件をクリアしたプロトタイプの構築を完了した．音声デザインに向けたインタフェース開発も論文として採録されており，当初定めた目標は順調に達成しつつある．加えて，コーパス構築，声質変換，音声知覚評価など多面的な取り組みを実施し，それぞれについて学会で発表するなど幅広く研究を進めていると考えている．
今後の研究の推進方策	本プロジェクトは2024年度が最終年度であるため，これまで検討してきた様々な内容について，国際会議発表や学術論文として採録されることを目指す．具体的に，ビスポーク音声デザインのプロトタイプは簡単な評価を実施しているにとどまっており，学会でプロトタイプを発表するのみである．同様に，他の検討内容も学術論文に至っていないものが複数ある．学術論文にするためには新たに大規模な主観評価実験を必要とするため，本年度の序盤は主観評価を中心に実施し，査読付きの国際会議や学術論文に投稿し，採録されることを目指す．

報告書

(4件)

研究成果
(123件)

すべて 2024 2023 2022 2021 その他

すべて雑誌論文 (26件) (うち査読あり 25件、オープンアクセス 18件) 学会発表 (91件) (うち国際学会 6件、招待講演 4件) 図書 (1件) 備考 (5件)

[雑誌論文] Interactive tools for making vocoder-based signal processing accessible: Flexible manipulation of speech attributes for explorational research and education2024
- 著者名/発表者名
  Kawahara Hideki、Morise Masanori
- 雑誌名
  
  Acoustical Science and Technology
  
  巻: 45 号: 1 ページ: 48-51
- DOI
  10.1250/ast.e23.52
- ISSN
  0369-4232, 1346-3969, 1347-5177
- 年月日
  2024-01-01
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] ヒューマンコミュニケーション研究から見る未来のかたち2024
- 著者名/発表者名
  新井田統、小森智康、酒向慎司、田中章浩、布川清彦
- 雑誌名
  
  電子情報通信学会誌
  
  巻: 107 ページ: 237-243
- 関連する報告書
  2023 実績報告書
[雑誌論文] Emotion-controllable Speech Synthesis using Emotion Soft Label, Utterance-level Prosodic Factors, and Word-level Prominence2024
- 著者名/発表者名
  Xuan Luo, Shinnosuke Takamichi, Yuki Saito, Tomoki Koriyama, Hiroshi Saruwatari
- 雑誌名
  
  APSIPA Transactions on Signal and Information Processing
  
  巻: 13 号: 1 ページ: 1-30
- DOI
  10.1561/116.00000242
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Parameter representation of group delay towards glottal-flow-based phase manipulation for channel vocoder2023
- 著者名/発表者名
  Koguchi Junya、Morise Masanori、Kawahara Hideki
- 雑誌名
  
  Acoustical Science and Technology
  
  巻: 44 号: 3 ページ: 189-192
- DOI
  10.1250/ast.44.189
- ISSN
  0369-4232, 1346-3969, 1347-5177
- 年月日
  2023-05-01
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] 身体言語と声による多感覚的な感情表現が人間の利他行動に及ぼす影響2023
- 著者名/発表者名
  澤田佳子・河原美彩子・田中章浩
- 雑誌名
  
  日本感性工学会論文誌
  
  巻: 22 号: 4 ページ: 405-416
- DOI
  10.5057/jjske.TJSKE-D-23-00024
- ISSN
  1884-0833, 1884-5258
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] COCO-NUT: Corpus of Japanese Utterance and Voice Characteristics Description for Prompt-Based Control2023
- 著者名/発表者名
  Watanabe Aya、Takamichi Shinnosuke、Saito Yuki、Nakata Wataru、Xin Detai、Saruwatari Hiroshi
- 雑誌名
  
  Proc. ASRU
  
  巻: －ページ: 1-8
- DOI
  10.1109/asru57964.2023.10389693
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] HumanDiffusion: diffusion model using perceptual gradients2023
- 著者名/発表者名
  Ueda Yota、Takamichi Shinnosuke、Saito Yuki、Takamune Norihiro、Saruwatari Hiroshi
- 雑誌名
  
  Proc. INTERSPEECH 2023
  
  巻: －ページ: 4264-4268
- DOI
  10.21437/interspeech.2023-1680
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] jaCappella Corpus: A Japanese a Cappella Vocal Ensemble Corpus2023
- 著者名/発表者名
  Nakamura Tomohiko、Takamichi Shinnosuke、Tanji Naoko、Fukayama Satoru、Saruwatari Hiroshi
- 雑誌名
  
  Proc. ICASSP 2023
  
  巻: －ページ: 1-5
- DOI
  10.1109/icassp49357.2023.10095569
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] MID-Attribute Speaker Generation Using Optimal-Transport-Based Interpolation of Gaussian Mixture Models2023
- 著者名/発表者名
  Watanabe Aya、Takamichi Shinnosuke、Saito Yuki、Xin Detai、Saruwatari Hiroshi
- 雑誌名
  
  Proc. ICASSP 2023
  
  巻: －ページ: 1-5
- DOI
  10.1109/icassp49357.2023.10097113
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Visual Onoma-to-Wave: Environmental Sound Synthesis from Visual Onomatopoeias and Sound-Source Images2023
- 著者名/発表者名
  Ohnaka Hien、Takamichi Shinnosuke、Imoto Keisuke、Okamoto Yuki、Fujii Kazuki、Saruwatari Hiroshi
- 雑誌名
  
  Proc. ICASSP 2023
  
  巻: －ページ: 1-5
- DOI
  10.1109/icassp49357.2023.10096517
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] VTTS: Visual-Text To Speech2023
- 著者名/発表者名
  Nakano Yoshifumi、Saeki Takaaki、Takamichi Shinnosuke、Sudoh Katsuhito、Saruwatari Hiroshi
- 雑誌名
  
  Proc. SLT 2023
  
  巻: －ページ: 936-942
- DOI
  10.1109/slt54892.2023.10022739
- 関連する報告書
  2023 実績報告書 2022 実績報告書
- 査読あり
[雑誌論文] Touch and voice have different advantages in perceiving positive and negative emotions2023
- 著者名/発表者名
  Oya Rika、Tanaka Akihiro
- 雑誌名
  
  i-Perception
  
  巻: 14 号: 2 ページ: 1-12
- DOI
  10.1177/20416695231160420
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] ROHAN：テキスト音声合成に向けたモーラバランス型日本語コーパス2022
- 著者名/発表者名
  森勢将雅
- 雑誌名
  
  日本音響学会誌
  
  巻: 79 号: 1 ページ: 9-17
- DOI
  10.20697/jasj.79.1_9
- ISSN
  0369-4232, 2432-2040
- 年月日
  2022-12-25
- 関連する報告書
  2022 実績報告書
- 査読あり
[雑誌論文] レアなモーラを含む日本語歌唱データベースの構築と基礎評価2022
- 著者名/発表者名
  森勢将雅、藤本健、小岩井ことり
- 雑誌名
  
  情報処理学会論文誌
  
  巻: 63 号: 9 ページ: 1523-1531
- DOI
  10.20729/00220098
- ISSN
  1882-7764
- 年月日
  2022-09-15
- 関連する報告書
  2022 実績報告書
- 査読あり
[雑誌論文] The interaction of emotional information from the voice and touch2022
- 著者名/発表者名
  Oya Rika、Tanaka Akihiro
- 雑誌名
  
  Acoustical Science and Technology
  
  巻: 43 号: 5 ページ: 291-293
- DOI
  10.1250/ast.43.291
- ISSN
  0369-4232, 1346-3969, 1347-5177
- 年月日
  2022-09-01
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] INmfCA Algorithm for Training of Nonparallel Voice Conversion Systems Based on Non-Negative Matrix Factorization2022
- 著者名/発表者名
  SUDA Hitoshi、KOTANI Gaku、SAITO Daisuke
- 雑誌名
  
  IEICE Transactions on Information and Systems
  
  巻: E105.D 号: 6 ページ: 1196-1210
- DOI
  10.1587/transinf.2021EDP7234
- ISSN
  0916-8532, 1745-1361
- 年月日
  2022-06-01
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Voice Conversion Based on Deep Neural Networks for Time-Variant Linear Transformations2022
- 著者名/発表者名
  Kotani Gaku、Saito Daisuke、Minematsu Nobuaki
- 雑誌名
  
  IEEE/ACM Transactions on Audio, Speech, and Language Processing
  
  巻: 30 ページ: 2981-2992
- DOI
  10.1109/taslp.2022.3205755
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Text-to-speech synthesis using spectral modeling based on non-negative autoencoder2022
- 著者名/発表者名
  Gorai Takeru、Saito Daisuke、Minematsu Nobuaki
- 雑誌名
  
  Proc. INTERSPEECH 2022
  
  巻: －ページ: 1621-1625
- DOI
  10.21437/interspeech.2022-10290
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] UTMOS: UTokyo-SaruLab System for VoiceMOS Challenge 20222022
- 著者名/発表者名
  Saeki Takaaki、Xin Detai、Nakata Wataru、Koriyama Tomoki、Takamichi Shinnosuke、Saruwatari Hiroshi
- 雑誌名
  
  Proc. INTERSPEECH 2022
  
  巻: －ページ: 4521-4525
- DOI
  10.21437/interspeech.2022-439
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] J-MAC: Japanese multi-speaker audiobook corpus for speech synthesis2022
- 著者名/発表者名
  Takamichi Shinnosuke、Nakata Wataru、Tanji Naoko、Saruwatari Hiroshi
- 雑誌名
  
  Proc. INTERSPEECH 2022
  
  巻: －ページ: 2358-2362
- DOI
  10.21437/interspeech.2022-444
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] SelfRemaster: Self-Supervised Speech Restoration with Analysis-by-Synthesis Approach Using Channel Modeling2022
- 著者名/発表者名
  Saeki Takaaki、Takamichi Shinnosuke、Nakamura Tomohiko、Tanji Naoko、Saruwatari Hiroshi
- 雑誌名
  
  Proc. INTERSPEECH 2022
  
  巻: －ページ: 4406-4410
- DOI
  10.21437/interspeech.2022-298
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Exploring the Effectiveness of Self-supervised Learning and Classifier Chains in Emotion Recognition of Nonverbal Vocalizations2022
- 著者名/発表者名
  Detai Xin, Shinnosuke Takamichi, and Saruwatari Hiroshi
- 雑誌名
  
  Proc. ICML ExVo Workshop
  
  巻: －
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] An objective test tool for pitch extractors' response attributes2022
- 著者名/発表者名
  Kawahara Hideki、Yatabe Kohei、Sakakibara Ken-Ichi、Kitamura Tatsuya、Banno Hideki、Morise Masanori
- 雑誌名
  
  Proc. INTERSPEECH 2022
  
  巻: －ページ: 659-663
- DOI
  10.21437/interspeech.2022-800
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Cross-cultural similarity and cultural specificity in the emotion perception from touch. Emotion.2022
- 著者名/発表者名
  Oya, R. & Tanaka, A.
- 雑誌名
  
  Emotion
  
  巻: - 号: 5 ページ: 1400-1409
- DOI
  10.1037/emo0001086
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] 顔・身体表現から探るトランスカルチャー2021
- 著者名/発表者名
  田中章浩，清水大地，小手川正二郎
- 雑誌名
  
  映像情報メディア学会誌
  
  巻: 75 ページ: 614-620
- NAID
  40022689419
- 関連する報告書
  2021 実績報告書
- 査読あり
[雑誌論文] Mixture of Orthogonal Sequences Made from Extended Time-Stretched Pulses Enables Measurement of Involuntary Voice Fundamental Frequency Response to Pitch Perturbation2021
- 著者名/発表者名
  H. Kawahara, T. Matsui, K. Yatabe, K.-I. Sakakibara, M. Tsuzaki, M. Morise, T. Irino
- 雑誌名
  
  Proc. Interspeech 2021
  
  巻: -- ページ: 3206-3210
- DOI
  10.21437/interspeech.2021-2073
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[学会発表] jMARS Recorder: コーパス朗読に特化した音声収録アプリの制作と検討2024
- 著者名/発表者名
  俣野文義
- 学会等名
  日本音響学会2024年春季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] 統計的基本周波数推定のためのデータ拡張の検討2024
- 著者名/発表者名
  小口純矢
- 学会等名
  日本音響学会2024年春季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] 音声モーフィングにおける自動対応付けの提案と品質評価2024
- 著者名/発表者名
  堀部貴紀
- 学会等名
  日本音響学会2024年春季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] 対照学習モデルによる音声-声質表現文の埋め込み表現獲得2024
- 著者名/発表者名
  渡邊亞椰
- 学会等名
  日本音響学会2024年春季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] 話者性を制御可能な音声合成のための話者埋め込み空間に関する実験的検討2024
- 著者名/発表者名
  森田湧大
- 学会等名
  電子情報通信学会音声研究会
- 関連する報告書
  2023 実績報告書
[学会発表] テキストのない音声に対する自己教師あり学習モデルによる音声合成の分析～多言語活用を中心に～2024
- 著者名/発表者名
  朴浚鎔
- 学会等名
  電子情報通信学会音声研究会
- 関連する報告書
  2023 実績報告書
[学会発表] 音源波形状に着目した地声-裏声変換と音源波パラメータの制御2024
- 著者名/発表者名
  岡田翔太
- 学会等名
  電子情報通信学会音声研究会
- 関連する報告書
  2023 実績報告書
[学会発表] 音声エージェントの印象に合致する音声の加工強度の予測2024
- 著者名/発表者名
  宮本蓮
- 学会等名
  電子情報通信学会音声研究会
- 関連する報告書
  2023 実績報告書
[学会発表] ChatGPTを活用した日本語コーパス文生成の基礎検討2023
- 著者名/発表者名
  石川真大
- 学会等名
  情報処理学会音楽情報科学研究会
- 関連する報告書
  2023 実績報告書
[学会発表] DNN音声合成による嫌悪感情の表現と基礎評価2023
- 著者名/発表者名
  俣野文義
- 学会等名
  情報処理学会音楽情報科学研究会
- 関連する報告書
  2023 実績報告書
[学会発表] モーラ単位で高さを制御可能な音声デザインを前提とした日本語テキスト音声合成システムの試作2023
- 著者名/発表者名
  森勢将雅
- 学会等名
  情報処理学会音楽情報科学研究会
- 関連する報告書
  2023 実績報告書
[学会発表] 日本語嫌悪感情音声の音響特徴量解析2023
- 著者名/発表者名
  俣野文義
- 学会等名
  日本音響学会2023年秋季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] リファレンスを必要としない相対的な音質評価に向けたMUSHRA法の改良について2023
- 著者名/発表者名
  田鎖佑弥
- 学会等名
  日本音響学会2023年秋季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] Coco-Nut: 自由記述文による声質制御に向けた多話者音声・声質自由記述ペアデータセット2023
- 著者名/発表者名
  渡邊亞椰
- 学会等名
  日本音響学会2023年秋季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] Are There Associations Between Voice and Color?2023
- 著者名/発表者名
  M. Kuwa
- 学会等名
  SARMAC XIV
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Multisensory emotion perception and its cultural differences2023
- 著者名/発表者名
  A. Tanaka
- 学会等名
  Cognitive Psychology Colloquium at Leiden University
- 関連する報告書
  2023 実績報告書
- 国際学会 / 招待講演
[学会発表] Immigration Modulates Audiovisual Emotion Integration in Adults: The Effect of the Host Culture and Migration itself2023
- 著者名/発表者名
  A. K. Nakamura
- 学会等名
  The 21st International Multisensory Research Forum
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] The Prototypical Expressions Can Facilitate the Perception of Various Positive Emotions through Face, Voice, and Touch2023
- 著者名/発表者名
  R. Oya
- 学会等名
  The 21st International Multisensory Research Forum
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] アンドロイドロボットによる身体・音声表現からの高次感情の知覚2023
- 著者名/発表者名
  山本寿子
- 学会等名
  日本認知科学会第40回大会
- 関連する報告書
  2023 実績報告書
[学会発表] Introduction of International Society for Research on Emotion (ISRE)2023
- 著者名/発表者名
  A. Tanaka
- 学会等名
  2023年度人工知能学会全国大会
- 関連する報告書
  2023 実績報告書
[学会発表] 薬局における男性薬剤師の身だしなみが患者の信頼感に与える影響2023
- 著者名/発表者名
  高橋利供
- 学会等名
  日本社会薬学会第41年会
- 関連する報告書
  2023 実績報告書
[学会発表] 音声合成システムの入力表現に関する分析的検討2023
- 著者名/発表者名
  朴浚鎔
- 学会等名
  日本音響学会2023年秋季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] 表現力の異なる話者埋め込み空間と主観的話者間類似度の比較2023
- 著者名/発表者名
  森田湧大
- 学会等名
  日本音響学会2023年秋季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] Integration of Throat Microphone Recording and Bandwidth Extension for Robust Assesment of L2 Speech2023
- 著者名/発表者名
  Yu Xu
- 学会等名
  日本音響学会2023年秋季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] Emotion transfer with controllable intensity for emotional speech synthesis based on self-supervised model2023
- 著者名/発表者名
  Wei Li
- 学会等名
  日本音響学会2023年秋季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] 知覚的話者間類似度との関連に着目した話者埋め込み空間の構成法の比較検討2023
- 著者名/発表者名
  森田湧大
- 学会等名
  電子情報通信学会音声研究会研究報告
- 関連する報告書
  2023 実績報告書
[学会発表] Improvement of Tacotron2 text-to-speech model based on masking operation and positional attention mechanism2023
- 著者名/発表者名
  Tong Ma
- 学会等名
  電子情報通信学会音声研究会
- 関連する報告書
  2023 実績報告書
[学会発表] Integration of Throat Microphone Recording and Bandwidth Extension for Robust Assessment of L2 Listening2023
- 著者名/発表者名
  Yu Xu
- 学会等名
  電子情報通信学会音声研究会
- 関連する報告書
  2023 実績報告書
[学会発表] Self-supervised learning model based emotion transfer and intensity control technology for expressive speech synthesis2023
- 著者名/発表者名
  Wei Li
- 学会等名
  電子情報通信学会音声研究会
- 関連する報告書
  2023 実績報告書
[学会発表] タッチ，音声，および表情からのポジティブ感情の知覚2023
- 著者名/発表者名
  大屋里佳，田中章浩
- 学会等名
  第13回多感覚研究会
- 関連する報告書
  2022 実績報告書
[学会発表] Visual onoma-to-wave：画像オノマトペと音源画像を利用した環境音合成の提案2023
- 著者名/発表者名
  大中緋慧，高道慎之介，井本桂右，岡本悠希，藤井一貴，猿渡洋
- 学会等名
  電子情報通信学会技術研究報告
- 関連する報告書
  2022 実績報告書
[学会発表] 日本語音声合成におけるアクセント句韻律特徴量の表現と予測2023
- 著者名/発表者名
  佐藤匡紀，高道慎之介，猿渡洋
- 学会等名
  電子情報通信学会技術研究報告
- 関連する報告書
  2022 実績報告書
[学会発表] 最適輸送による GMM 補間を用いた中間属性の非実在話者生成2023
- 著者名/発表者名
  渡邊亞椰，高道慎之介，齋藤佑樹，辛徳泰，猿渡洋
- 学会等名
  日本音響学会2023年春季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 学習・評価ループを用いたデータ選択によるダークデータからの音声合成2023
- 著者名/発表者名
  関健太郎，高道慎之介，佐伯高明，猿渡洋
- 学会等名
  日本音響学会2023年春季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 自由記述文による声質制御に向けたin-the-wild文データ収集法2023
- 著者名/発表者名
  渡邊亞椰，高道慎之介，齋藤佑樹，猿渡洋
- 学会等名
  電子情報通信学会技術研究報告
- 関連する報告書
  2022 実績報告書
[学会発表] 音声モーフィングにおける時間軸方向の対応点数が品質に与える影響2023
- 著者名/発表者名
  堀部貴紀，森勢将雅，河原英紀
- 学会等名
  日本音響学会2023年春季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 朗読音声の発話スタイルを対象とした音響特徴量解析2023
- 著者名/発表者名
  小口純矢，森勢将雅
- 学会等名
  日本音響学会2023年春季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] そのエージェントの声、合っていますか？-声質変換技術と印象適合・人工感制御-2022
- 著者名/発表者名
  齋藤大輔
- 学会等名
  第40回日本ロボット学会学術講演会
- 関連する報告書
  2022 実績報告書
- 招待講演
[学会発表] Domain Adaptation and Language Conditioning to Improve Phonetic Posteriorgram Based Cross-Lingual Voice Conversion2022
- 著者名/発表者名
  P. Hsu, N. Minematsu, D. Saito
- 学会等名
  Proc. APSIPA
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] An Experimental Study on Applying Self-Supervised Speech Representations to Cross-Lingual Voice Conversion2022
- 著者名/発表者名
  P. Hsu, N. Minematsu, D. Saito
- 学会等名
  日本音響学会2022年秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] LSTM-RNN音声合成における言語特徴量の時間的冗長性の削減に関する検討2022
- 著者名/発表者名
  チェジェヒョン, 五来丈瑠, 小谷岳, 齋藤大輔, 峯松信明
- 学会等名
  情報処理学会研究報告
- 関連する報告書
  2022 実績報告書
[学会発表] 身体と声色からの視聴覚感情知覚の発達的変化2022
- 著者名/発表者名
  山本寿子，田中章浩
- 学会等名
  日本心理学会第86回大会
- 関連する報告書
  2022 実績報告書
[学会発表] ラジオ聴取経験が及ぼす音声感情知覚への影響2022
- 著者名/発表者名
  鍬真衣，田中章浩
- 学会等名
  日本音響学会2022年秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 非言語的な発声によるポジティブ感情の表出と知覚2022
- 著者名/発表者名
  大屋里佳，田中章浩
- 学会等名
  日本音響学会2022年秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] The perception of positive emotion from face, voice, and touch2022
- 著者名/発表者名
  R.Oya, A. Tanaka
- 学会等名
  Proc. ISRE22
- 関連する報告書
  2022 実績報告書
[学会発表] 自己教師あり学習と分類器チェーンを用いた非言語的発声に対する感情識別2022
- 著者名/発表者名
  辛徳泰，高道慎之介，猿渡洋
- 学会等名
  日本音響学会2022年秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 避難呼びかけ音声の持つ緊急性の分析と音声合成への適用の検討2022
- 著者名/発表者名
  原田そら，中田亘，高道慎之介，齋藤佑樹，齋藤康之，猿渡洋
- 学会等名
  日本音響学会2022年秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] UTMOS：VoiceMOS Challenge2022 に向けたUTokyo-Sarulab チームの自然性 MOS 予測モデル2022
- 著者名/発表者名
  中田亘，辛德泰，佐伯高明，郡山知樹，高道慎之介，猿渡洋
- 学会等名
  日本音響学会2022年秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] jaCappella コーパス：重唱分離・合成に向けた日本語アカペラ歌唱コーパス2022
- 著者名/発表者名
  中村友彦，高道慎之介，丹治尚子，深山覚，猿渡洋
- 学会等名
  日本音響学会2022年秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 知覚に伴う音声合成に向けた機械学習とコーパス2022
- 著者名/発表者名
  高道慎之介
- 学会等名
  日本音響学会2022年秋季研究発表会
- 関連する報告書
  2022 実績報告書
- 招待講演
[学会発表] A practical method for generating whisper voices: Improvements in phantom silhouette method and application to multiple languages2022
- 著者名/発表者名
  T. Uchida and M. Morise
- 学会等名
  Proc. ICA 2022
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Crazy vocoderは砕けない～でもちょっとくだけた未来の話を～2022
- 著者名/発表者名
  森勢将雅
- 学会等名
  電子情報通信学会技術研究報告
- 関連する報告書
  2022 実績報告書
- 招待講演
[学会発表] 音声分析合成基盤WORLDのGUI実装と見えてきた課題2022
- 著者名/発表者名
  河原英紀，森勢将雅
- 学会等名
  電子情報通信学会技術研究報告
- 関連する報告書
  2022 実績報告書
[学会発表] 変調周波数伝達特性と周波数応答で音声処理を調べよう2022
- 著者名/発表者名
  河原英紀，矢田部浩平，榊原健，北村達也，坂野秀樹，森勢将雅
- 学会等名
  情報処理学会音楽情報科学研究会
- 関連する報告書
  2022 実績報告書
[学会発表] 音楽経験の有無が音高錯覚現象の知覚に与える影響の比較ー子供を対象とした結果の解析ー2022
- 著者名/発表者名
  田鎖佑弥，森勢将雅
- 学会等名
  情報処理学会音楽情報科学研究会
- 関連する報告書
  2022 実績報告書
[学会発表] 声を含むデータベースの「使いやすさ」に関する一考察～No.7音声・歌唱データベース構築を実例として～2022
- 著者名/発表者名
  森勢将雅
- 学会等名
  情報処理学会音声言語情報処理研究会
- 関連する報告書
  2022 実績報告書
[学会発表] 実用的なささやき声の生成法：Phantom Silhouette方式の多言語対応とユーザによる声色調整2022
- 著者名/発表者名
  内田照久，森勢将雅
- 学会等名
  日本音響学会2022年秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 自動推定された音素境界とフォルマントによる音声モーフィングの品質評価2022
- 著者名/発表者名
  堀部貴紀，森勢将雅，河原英紀
- 学会等名
  日本音響学会2022年秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 拡張音声モーフィングによるポップアウト属性の検証可能性2022
- 著者名/発表者名
  河原英紀，森勢将雅，榊原健一，北村達也，牧勝弘
- 学会等名
  日本音響学会2022年秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] プロ声優を対象とした大規模コーパス朗読におけるリテイク数の比較2022
- 著者名/発表者名
  山本泰我，小口純矢，森勢将雅
- 学会等名
  日本音響学会2022年秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] Speaking Rate Control by HiFi-GAN using Feature Interpolation2022
- 著者名/発表者名
  辛徳泰，高道慎之介，岡本拓磨，河井恒，猿渡洋
- 学会等名
  情報処理学会研究報告
- 関連する報告書
  2021 実績報告書
[学会発表] 画像文字からの音声合成2022
- 著者名/発表者名
  中野嘉文，佐伯高明，高道慎之介，須藤克仁，猿渡洋
- 学会等名
  言語処理学会第28回年次大会
- 関連する報告書
  2021 実績報告書
[学会発表] JTubeSpeech: 音声認識と話者照合のためにYouTubeから構築される日本語音声コーパス2022
- 著者名/発表者名
  高道慎之介，K. Ludwig，佐伯高明，塩田さやか，渡部晋治
- 学会等名
  言語処理学会第28回年次大会
- 関連する報告書
  2021 実績報告書
[学会発表] パラメータ最適化を用いた信号処理による仮名化手法の復号攻撃に対するロバスト性評価2022
- 著者名/発表者名
  甲斐優人，高道慎之介，塩田さやか，貴家仁志
- 学会等名
  電子情報通信学会技術研究報告
- 関連する報告書
  2021 実績報告書
[学会発表] ソース・フィルタ・チャネル分解に基づく自己教師ありニューラル音声復元2022
- 著者名/発表者名
  佐伯高明，高道慎之介，中村友彦，丹治尚子，猿渡洋
- 学会等名
  情報処理学会研究報告
- 関連する報告書
  2021 実績報告書
[学会発表] タッチや音声による感情知覚2022
- 著者名/発表者名
  大屋里佳，田中章浩
- 学会等名
  第12回多感覚研究会
- 関連する報告書
  2021 実績報告書
[学会発表] WORLDに基づく時変多属性任意事例数モーフィングと周辺ツールの実装について2022
- 著者名/発表者名
  河原英紀，森勢将雅
- 学会等名
  日本音響学会2022年春季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 複素ケプストラムに基づく音源の位相特性を用いた音声波形生成2022
- 著者名/発表者名
  小口純矢，森勢将雅
- 学会等名
  日本音響学会2022年春季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] テキスト音声合成に向けたモーラバランス型コーパスの提案と評価2022
- 著者名/発表者名
  森勢将雅
- 学会等名
  日本音響学会2022年春季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 音高錯覚現象における大人と子供の比較2022
- 著者名/発表者名
  田鎖佑弥，森勢将雅
- 学会等名
  日本音響学会2022年春季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 基本周波数変化に伴うスペクトルの動的変動を考慮した自然性を維持できる音高変換の検討2022
- 著者名/発表者名
  金井郁也，森勢将雅
- 学会等名
  日本音響学会2022年春季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 音声仮名化のための加工音声重畳と非可逆性評価2021
- 著者名/発表者名
  甲斐優人，高道慎之介，塩田さやか，貴家仁志
- 学会等名
  日本音響学会2021年秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 魅力的な音声に影響する音響特徴の検討2021
- 著者名/発表者名
  和田夏美，大屋里佳，長島太郎，小池貴久，田中章浩
- 学会等名
  第23回日本感性工学会大会
- 関連する報告書
  2021 実績報告書
[学会発表] 自己の発話に対する他人声のフィードバックが声の所有感に与える影響2021
- 著者名/発表者名
  中川優奈，田中章浩
- 学会等名
  日本音響学会2021年秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 自分と他人の声の境界は変化するか2021
- 著者名/発表者名
  中川優奈，田中章浩
- 学会等名
  電子情報通信学会ヒューマン情報処理研究会
- 関連する報告書
  2021 実績報告書
[学会発表] ITAコーパス：パブリックドメインの音素バランス文からなる日本語テキストコーパスの構築と基礎評価2021
- 著者名/発表者名
  小口純矢，金井郁也，小田恭央，齊藤剛史，森勢将雅
- 学会等名
  情報処理学会音楽情報科学研究会
- 関連する報告書
  2021 実績報告書
[学会発表] レアなモーラを含む日本語歌唱データベースの構築と基礎評価2021
- 著者名/発表者名
  森勢将雅，藤本健，小岩井ことり
- 学会等名
  第20回情報科学技術フォーラム
- 関連する報告書
  2021 実績報告書
[学会発表] 声帯音源の群遅延特性に基づく特徴量を用いた励振源による有声音波形生成法の提案と評価2021
- 著者名/発表者名
  小口純矢，森勢将雅
- 学会等名
  日本音響学会2021年秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 音声分析合成システムの無声音生成に用いる励起信号の違いが分析合成音の品質劣化に与える影響の調査2021
- 著者名/発表者名
  田鎖佑弥，森勢将雅
- 学会等名
  日本音響学会2021年秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 歌声の基本周波数変化に伴う音色変化に対応する動的変動量の解析2021
- 著者名/発表者名
  金井郁也，森勢将雅
- 学会等名
  日本音響学会2021年秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 波形の相互相関に基づく基本周波数推定における距離尺度による影響の調査2021
- 著者名/発表者名
  小口純矢，森勢将雅
- 学会等名
  日本音響学会2021年秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] Interactive and Real-Time Acoustic Measurement Tools for Speech Data Acquisition and Presentation: Application of an Extended Member of Time Stretched Pulses2021
- 著者名/発表者名
  Kawahara, H., Yatabe, K., Sakakibara, K.-I., Mizumachi, M., Morise, M., Banno, H., Irino, T.
- 学会等名
  Interspeech 2021
- 関連する報告書
  2021 実績報告書
[学会発表] IMPLEMENTATION OF INTERACTIVE TOOLS FOR INVESTIGATING FUNDAMENTAL FREQUENCY RESPONSE OF VOICED SOUNDS TO AUDITORY STIMULATION2021
- 著者名/発表者名
  H. Kawahara, T. Irino, T. Matsui, K. Yatabe, K. Sakakibara, M. Tsuzaki, M. Morise
- 学会等名
  APSIPA 2021
- 関連する報告書
  2021 実績報告書
[学会発表] スペクトル差異に着目した単独歌唱音声の合唱への最適化の検討2021
- 著者名/発表者名
  稲津遥太郎，齋藤大輔，峯松信明
- 学会等名
  情報処理学会研究報告
- 関連する報告書
  2021 実績報告書
[学会発表] 固有声変換法を用いた重唱における調和度制御に関する検討2021
- 著者名/発表者名
  菊地晏南，齋藤大輔，峯松信明
- 学会等名
  情報処理学会研究報告
- 関連する報告書
  2021 実績報告書
[学会発表] 自然な斉唱音声合成のための複数歌唱者の基本周波数パターン制御に関する検討2021
- 著者名/発表者名
  勝瑞雄介，齋藤大輔，峯松信明
- 学会等名
  情報処理学会研究報告
- 関連する報告書
  2021 実績報告書
[学会発表] A fine-grained prosody control approach for improving the diversity of emotional text-to-speech2021
- 著者名/発表者名
  J. Zhang，D. Saito，N. Minematsu
- 学会等名
  日本音響学会2021年秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 統計的音声合成のための非負値自己符号化器を用いた音響モデリングの検討2021
- 著者名/発表者名
  五来丈瑠，齋藤大輔，峯松信明
- 学会等名
  日本音響学会2021年秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 自然音声の人工感を連続的に制御する技術の検討と評価2021
- 著者名/発表者名
  今村奏海，増田尚建，須田仁志，齋藤大輔，峯松信明
- 学会等名
  日本音響学会2021年秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 対話型遺伝的アルゴリズムを用いた自己聴取音合成のためのパラメータ推定2021
- 著者名/発表者名
  田中尚輝，増田尚建，齋藤大輔，峯松信明
- 学会等名
  日本音響学会2021年秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] An Experimental Study on Language Conditioning in Phonetic Posteriorgrams based Cross-lingual Voice Conversion2021
- 著者名/発表者名
  P. Hsu，N. Minematsu，D. Saito
- 学会等名
  日本音響学会2021年秋季研究発表会
- 関連する報告書
  2021 実績報告書
[図書] 顔を聞き、声を見る2022
- 著者名/発表者名
  日本認知科学会、田中章浩
- 総ページ数
  268
- 出版者
  共立出版
- ISBN
  4320094697
- 関連する報告書
  2022 実績報告書
[備考] 自由記述文による声質制御に向けた多話者音声・声質自由記述ペアデータセット
- URL
  https://sites.google.com/site/shinnosuketakamichi/research-topics/coconut_corpus
- 関連する報告書
  2023 実績報告書
[備考] jaCappellaコーパス
- URL
  https://tomohikonakamura.github.io/jaCappella_corpus/
- 関連する報告書
  2023 実績報告書
[備考] 研究者向け音声合成検証用No.7音声データベース
- URL
  https://voiceseven.com/7rdev/login.php
- 関連する報告書
  2021 実績報告書
[備考] ROHAN：モーラバランス型日本語コーパス
- URL
  https://github.com/mmorise/rohan4600
- 関連する報告書
  2021 実績報告書
[備考] ITAコーパス
- URL
  https://github.com/mmorise/ita-corpus
- 関連する報告書
  2021 実績報告書

ビスポーク音声デザインの骨格形成と体系化

研究代表者

森勢 将雅 明治大学, 総合数理学部, 専任教授 (60510013)

42,770千円 (直接経費: 32,900千円、間接経費: 9,870千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] Interactive tools for making vocoder-based signal processing accessible: Flexible manipulation of speech attributes for explorational research and education2024

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[雑誌論文] ヒューマンコミュニケーション研究から見る未来のかたち2024

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Emotion-controllable Speech Synthesis using Emotion Soft Label, Utterance-level Prosodic Factors, and Word-level Prominence2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Parameter representation of group delay towards glottal-flow-based phase manipulation for channel vocoder2023

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[雑誌論文] 身体言語と声による多感覚的な感情表現が人間の利他行動に及ぼす影響2023

著者名/発表者名

雑誌名

DOI

ISSN

関連する報告書

[雑誌論文] COCO-NUT: Corpus of Japanese Utterance and Voice Characteristics Description for Prompt-Based Control2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] HumanDiffusion: diffusion model using perceptual gradients2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] jaCappella Corpus: A Japanese a Cappella Vocal Ensemble Corpus2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] MID-Attribute Speaker Generation Using Optimal-Transport-Based Interpolation of Gaussian Mixture Models2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Visual Onoma-to-Wave: Environmental Sound Synthesis from Visual Onomatopoeias and Sound-Source Images2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] VTTS: Visual-Text To Speech2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Touch and voice have different advantages in perceiving positive and negative emotions2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] ROHAN：テキスト音声合成に向けたモーラバランス型日本語コーパス2022

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[雑誌論文] レアなモーラを含む日本語歌唱データベースの構築と基礎評価2022

森勢将雅明治大学, 総合数理学部, 専任教授 (60510013)