• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

ビスポーク音声デザインの骨格形成と体系化

Research Project

Project/Area Number 21H04900
Research Category

Grant-in-Aid for Scientific Research (A)

Allocation TypeSingle-year Grants
Section一般
Review Section Medium-sized Section 61:Human informatics and related fields
Research InstitutionMeiji University

Principal Investigator

森勢 将雅  明治大学, 総合数理学部, 専任教授 (60510013)

Co-Investigator(Kenkyū-buntansha) 田中 章浩  東京女子大学, 現代教養学部, 教授 (80396530)
齋藤 大輔  東京大学, 大学院工学系研究科(工学部), 准教授 (40615150)
高道 慎之介  慶應義塾大学, 理工学部(矢上), 准教授 (90784330)
Project Period (FY) 2021-04-05 – 2025-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥42,770,000 (Direct Cost: ¥32,900,000、Indirect Cost: ¥9,870,000)
Fiscal Year 2024: ¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2023: ¥6,370,000 (Direct Cost: ¥4,900,000、Indirect Cost: ¥1,470,000)
Fiscal Year 2022: ¥11,050,000 (Direct Cost: ¥8,500,000、Indirect Cost: ¥2,550,000)
Fiscal Year 2021: ¥20,670,000 (Direct Cost: ¥15,900,000、Indirect Cost: ¥4,770,000)
Keywords音声・歌声情報処理 / 音声デザイン / 声質変換 / 音声知覚 / 音声情報処理 / 音声合成
Outline of Research at the Start

最先端のテキスト音声合成は人間とほぼ等価な音声を合成可能であり,すでにスマートスピーカなどで利用されている.一方,同じテキストでも状況により表現を柔軟に加工できる技術は,主にコンテンツ制作の領域において需要がある.本研究は,音声合成研究の新たな方向性として,計算機があたかも職人のようにユーザと共同し,ユーザの音声デザインを助ける技術開発を目指す.心理学分野と連携し,テキスト音声合成や声質変換に適した音声制御のための心理パラメータを明らかにする.ユーザが大まかにデザインした結果を計算機が微調整し,自然な音声を合成する一連の技術を「ビスポーク音声デザイン」として体系化することが狙いである.

Outline of Annual Research Achievements

2023年度は,ビスポーク音声デザインのプロトタイプとして,点ピッチの考え方に基づき,モーラ単位でピッチ情報粗く制御できつつ自然な音声を生成可能なDNN音声合成を実装した.ピッチ制御についてはピッチ軌跡そのものをデザインすることも可能であるが,「ビスポーク」的なデザイン法として,ユーザーは大雑把なピッチ情報のみ与えることを重視している.合成音声の品質と目的のイントネーションを再現できるかについて主観評価を実施し,提案する方法が既存の方法よりも高い性能であることを確認した.
次いで,音声デザインインタフェースの検討として,音声の分析からサポートするGUIについて検討を進めた.このGUIは,音声研究の専門家に向けて全てのパラメータを細かくチューニングできるものではなく,音声加工の初心者が試行錯誤的にピッチなどを加工できることをコンセプトとしている.様々な環境で多くの被験者に対する利用実績とフィードバックに基づいて改良を加えたものを暫定的なインタフェースとして採用した.本GUIについては学術論文として採録された.
最後に,新たな音声評価法について検討した.現時点での音声合成の音質評価では,多くの論文でMOS (mean opinion score)が採用されている.MOSによる主観評価では音質差の検出力が低いため,特に合成音声の品質向上が著しく昨今では膨大な被験者数に基づく評価事例が増えつつあり,評価にかかるコストが増大している.そこで本課題では,新たに高品質な合成音声に対し,MOSよりも少人数で差の検出が可能な方法を提案した.同じ音声群を用いた評価をMOSと提案法とで実施し,同人数の評価結果であれば提案法のほうが差をより顕著に検出できることを確認した.
上記が代表的な成果であるが,合成音声,音声コーパス作成,声質変換,音声知覚実験に関する成果報告も多数実施してきた.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

目標とする音声デザインの技術的な課題について,ピッチ情報について最低限の条件をクリアしたプロトタイプの構築を完了した.音声デザインに向けたインタフェース開発も論文として採録されており,当初定めた目標は順調に達成しつつある.加えて,コーパス構築,声質変換,音声知覚評価など多面的な取り組みを実施し,それぞれについて学会で発表するなど幅広く研究を進めていると考えている.

Strategy for Future Research Activity

本プロジェクトは2024年度が最終年度であるため,これまで検討してきた様々な内容について,国際会議発表や学術論文として採録されることを目指す.具体的に,ビスポーク音声デザインのプロトタイプは簡単な評価を実施しているにとどまっており,学会でプロトタイプを発表するのみである.同様に,他の検討内容も学術論文に至っていないものが複数ある.学術論文にするためには新たに大規模な主観評価実験を必要とするため,本年度の序盤は主観評価を中心に実施し,査読付きの国際会議や学術論文に投稿し,採録されることを目指す.

Report

(4 results)
  • 2023 Annual Research Report
  • 2022 Annual Research Report
  • 2021 Comments on the Screening Results   Annual Research Report
  • Research Products

    (123 results)

All 2024 2023 2022 2021 Other

All Journal Article (26 results) (of which Peer Reviewed: 25 results,  Open Access: 18 results) Presentation (91 results) (of which Int'l Joint Research: 6 results,  Invited: 4 results) Book (1 results) Remarks (5 results)

  • [Journal Article] Interactive tools for making vocoder-based signal processing accessible: Flexible manipulation of speech attributes for explorational research and education2024

    • Author(s)
      Kawahara Hideki、Morise Masanori
    • Journal Title

      Acoustical Science and Technology

      Volume: 45 Issue: 1 Pages: 48-51

    • DOI

      10.1250/ast.e23.52

    • ISSN
      0369-4232, 1346-3969, 1347-5177
    • Year and Date
      2024-01-01
    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] ヒューマンコミュニケーション研究から見る未来のかたち2024

    • Author(s)
      新井田統、小森智康、酒向慎司、田中章浩、布川清彦
    • Journal Title

      電子情報通信学会誌

      Volume: 107 Pages: 237-243

    • Related Report
      2023 Annual Research Report
  • [Journal Article] Emotion-controllable Speech Synthesis using Emotion Soft Label, Utterance-level Prosodic Factors, and Word-level Prominence2024

    • Author(s)
      Xuan Luo, Shinnosuke Takamichi, Yuki Saito, Tomoki Koriyama, Hiroshi Saruwatari
    • Journal Title

      APSIPA Transactions on Signal and Information Processing

      Volume: 13 Issue: 1 Pages: 1-30

    • DOI

      10.1561/116.00000242

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Parameter representation of group delay towards glottal-flow-based phase manipulation for channel vocoder2023

    • Author(s)
      Koguchi Junya、Morise Masanori、Kawahara Hideki
    • Journal Title

      Acoustical Science and Technology

      Volume: 44 Issue: 3 Pages: 189-192

    • DOI

      10.1250/ast.44.189

    • ISSN
      0369-4232, 1346-3969, 1347-5177
    • Year and Date
      2023-05-01
    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Effects of Humans’ and Robots’ Multisensory Emotional Expressions by Body language and Voice on Human Altruistic Behavior2023

    • Author(s)
      澤田佳子・河原美彩子・田中章浩
    • Journal Title

      Transactions of Japan Society of Kansei Engineering

      Volume: 22 Issue: 4 Pages: 405-416

    • DOI

      10.5057/jjske.TJSKE-D-23-00024

    • ISSN
      1884-0833, 1884-5258
    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] COCO-NUT: Corpus of Japanese Utterance and Voice Characteristics Description for Prompt-Based Control2023

    • Author(s)
      Watanabe Aya、Takamichi Shinnosuke、Saito Yuki、Nakata Wataru、Xin Detai、Saruwatari Hiroshi
    • Journal Title

      Proc. ASRU

      Volume: - Pages: 1-8

    • DOI

      10.1109/asru57964.2023.10389693

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] HumanDiffusion: diffusion model using perceptual gradients2023

    • Author(s)
      Ueda Yota、Takamichi Shinnosuke、Saito Yuki、Takamune Norihiro、Saruwatari Hiroshi
    • Journal Title

      Proc. INTERSPEECH 2023

      Volume: - Pages: 4264-4268

    • DOI

      10.21437/interspeech.2023-1680

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] jaCappella Corpus: A Japanese a Cappella Vocal Ensemble Corpus2023

    • Author(s)
      Nakamura Tomohiko、Takamichi Shinnosuke、Tanji Naoko、Fukayama Satoru、Saruwatari Hiroshi
    • Journal Title

      Proc. ICASSP 2023

      Volume: - Pages: 1-5

    • DOI

      10.1109/icassp49357.2023.10095569

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed
  • [Journal Article] MID-Attribute Speaker Generation Using Optimal-Transport-Based Interpolation of Gaussian Mixture Models2023

    • Author(s)
      Watanabe Aya、Takamichi Shinnosuke、Saito Yuki、Xin Detai、Saruwatari Hiroshi
    • Journal Title

      Proc. ICASSP 2023

      Volume: - Pages: 1-5

    • DOI

      10.1109/icassp49357.2023.10097113

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Visual Onoma-to-Wave: Environmental Sound Synthesis from Visual Onomatopoeias and Sound-Source Images2023

    • Author(s)
      Ohnaka Hien、Takamichi Shinnosuke、Imoto Keisuke、Okamoto Yuki、Fujii Kazuki、Saruwatari Hiroshi
    • Journal Title

      Proc. ICASSP 2023

      Volume: - Pages: 1-5

    • DOI

      10.1109/icassp49357.2023.10096517

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed
  • [Journal Article] VTTS: Visual-Text To Speech2023

    • Author(s)
      Nakano Yoshifumi、Saeki Takaaki、Takamichi Shinnosuke、Sudoh Katsuhito、Saruwatari Hiroshi
    • Journal Title

      Proc. SLT 2023

      Volume: - Pages: 936-942

    • DOI

      10.1109/slt54892.2023.10022739

    • Related Report
      2023 Annual Research Report 2022 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Touch and voice have different advantages in perceiving positive and negative emotions2023

    • Author(s)
      Oya Rika、Tanaka Akihiro
    • Journal Title

      i-Perception

      Volume: 14 Issue: 2 Pages: 1-12

    • DOI

      10.1177/20416695231160420

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] ROHAN: A mora-balanced Japanese text corpus for text-to-speech synthesis2022

    • Author(s)
      森勢 将雅
    • Journal Title

      THE JOURNAL OF THE ACOUSTICAL SOCIETY OF JAPAN

      Volume: 79 Issue: 1 Pages: 9-17

    • DOI

      10.20697/jasj.79.1_9

    • ISSN
      0369-4232, 2432-2040
    • Year and Date
      2022-12-25
    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Building a Japanese Singing Database Including Rare Moras and Its Evaluation2022

    • Author(s)
      森勢 将雅、藤本 健、小岩井 ことり
    • Journal Title

      情報処理学会論文誌

      Volume: 63 Issue: 9 Pages: 1523-1531

    • DOI

      10.20729/00220098

    • ISSN
      1882-7764
    • Year and Date
      2022-09-15
    • Related Report
      2022 Annual Research Report
    • Peer Reviewed
  • [Journal Article] The interaction of emotional information from the voice and touch2022

    • Author(s)
      Oya Rika、Tanaka Akihiro
    • Journal Title

      Acoustical Science and Technology

      Volume: 43 Issue: 5 Pages: 291-293

    • DOI

      10.1250/ast.43.291

    • ISSN
      0369-4232, 1346-3969, 1347-5177
    • Year and Date
      2022-09-01
    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] INmfCA Algorithm for Training of Nonparallel Voice Conversion Systems Based on Non-Negative Matrix Factorization2022

    • Author(s)
      SUDA Hitoshi、KOTANI Gaku、SAITO Daisuke
    • Journal Title

      IEICE Transactions on Information and Systems

      Volume: E105.D Issue: 6 Pages: 1196-1210

    • DOI

      10.1587/transinf.2021EDP7234

    • ISSN
      0916-8532, 1745-1361
    • Year and Date
      2022-06-01
    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Voice Conversion Based on Deep Neural Networks for Time-Variant Linear Transformations2022

    • Author(s)
      Kotani Gaku、Saito Daisuke、Minematsu Nobuaki
    • Journal Title

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      Volume: 30 Pages: 2981-2992

    • DOI

      10.1109/taslp.2022.3205755

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Text-to-speech synthesis using spectral modeling based on non-negative autoencoder2022

    • Author(s)
      Gorai Takeru、Saito Daisuke、Minematsu Nobuaki
    • Journal Title

      Proc. INTERSPEECH 2022

      Volume: - Pages: 1621-1625

    • DOI

      10.21437/interspeech.2022-10290

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] UTMOS: UTokyo-SaruLab System for VoiceMOS Challenge 20222022

    • Author(s)
      Saeki Takaaki、Xin Detai、Nakata Wataru、Koriyama Tomoki、Takamichi Shinnosuke、Saruwatari Hiroshi
    • Journal Title

      Proc. INTERSPEECH 2022

      Volume: - Pages: 4521-4525

    • DOI

      10.21437/interspeech.2022-439

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] J-MAC: Japanese multi-speaker audiobook corpus for speech synthesis2022

    • Author(s)
      Takamichi Shinnosuke、Nakata Wataru、Tanji Naoko、Saruwatari Hiroshi
    • Journal Title

      Proc. INTERSPEECH 2022

      Volume: - Pages: 2358-2362

    • DOI

      10.21437/interspeech.2022-444

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] SelfRemaster: Self-Supervised Speech Restoration with Analysis-by-Synthesis Approach Using Channel Modeling2022

    • Author(s)
      Saeki Takaaki、Takamichi Shinnosuke、Nakamura Tomohiko、Tanji Naoko、Saruwatari Hiroshi
    • Journal Title

      Proc. INTERSPEECH 2022

      Volume: - Pages: 4406-4410

    • DOI

      10.21437/interspeech.2022-298

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Exploring the Effectiveness of Self-supervised Learning and Classifier Chains in Emotion Recognition of Nonverbal Vocalizations2022

    • Author(s)
      Detai Xin, Shinnosuke Takamichi, and Saruwatari Hiroshi
    • Journal Title

      Proc. ICML ExVo Workshop

      Volume: -

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] An objective test tool for pitch extractors' response attributes2022

    • Author(s)
      Kawahara Hideki、Yatabe Kohei、Sakakibara Ken-Ichi、Kitamura Tatsuya、Banno Hideki、Morise Masanori
    • Journal Title

      Proc. INTERSPEECH 2022

      Volume: - Pages: 659-663

    • DOI

      10.21437/interspeech.2022-800

    • Related Report
      2022 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Cross-cultural similarity and cultural specificity in the emotion perception from touch. Emotion.2022

    • Author(s)
      Oya, R. & Tanaka, A.
    • Journal Title

      Emotion

      Volume: - Issue: 5 Pages: 1400-1409

    • DOI

      10.1037/emo0001086

    • Related Report
      2021 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] 顔・身体表現から探るトランスカルチャー2021

    • Author(s)
      田中章浩,清水大地,小手川正二郎
    • Journal Title

      映像情報メディア学会誌

      Volume: 75 Pages: 614-620

    • NAID

      40022689419

    • Related Report
      2021 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Mixture of Orthogonal Sequences Made from Extended Time-Stretched Pulses Enables Measurement of Involuntary Voice Fundamental Frequency Response to Pitch Perturbation2021

    • Author(s)
      H. Kawahara, T. Matsui, K. Yatabe, K.-I. Sakakibara, M. Tsuzaki, M. Morise, T. Irino
    • Journal Title

      Proc. Interspeech 2021

      Volume: -- Pages: 3206-3210

    • DOI

      10.21437/interspeech.2021-2073

    • Related Report
      2021 Annual Research Report
    • Peer Reviewed / Open Access
  • [Presentation] jMARS Recorder: コーパス朗読に特化した音声収録アプリの制作と検討2024

    • Author(s)
      俣野文義
    • Organizer
      日本音響学会2024年春季研究発表会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 統計的基本周波数推定のためのデータ拡張の検討2024

    • Author(s)
      小口純矢
    • Organizer
      日本音響学会2024年春季研究発表会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 音声モーフィングにおける自動対応付けの提案と品質評価2024

    • Author(s)
      堀部貴紀
    • Organizer
      日本音響学会2024年春季研究発表会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 対照学習モデルによる音声-声質表現文の埋め込み表現獲得2024

    • Author(s)
      渡邊亞椰
    • Organizer
      日本音響学会2024年春季研究発表会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 話者性を制御可能な音声合成のための話者埋め込み空間に関する実験的検討2024

    • Author(s)
      森田湧大
    • Organizer
      電子情報通信学会音声研究会
    • Related Report
      2023 Annual Research Report
  • [Presentation] テキストのない音声に対する自己教師あり学習モデルによる音声合成の分析 ~多言語活用を中心に~2024

    • Author(s)
      朴浚鎔
    • Organizer
      電子情報通信学会音声研究会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 音源波形状に着目した地声-裏声変換と音源波パラメータの制御2024

    • Author(s)
      岡田翔太
    • Organizer
      電子情報通信学会音声研究会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 音声エージェントの印象に合致する音声の加工強度の予測2024

    • Author(s)
      宮本蓮
    • Organizer
      電子情報通信学会音声研究会
    • Related Report
      2023 Annual Research Report
  • [Presentation] ChatGPTを活用した日本語コーパス文生成の基礎検討2023

    • Author(s)
      石川真大
    • Organizer
      情報処理学会音楽情報科学研究会
    • Related Report
      2023 Annual Research Report
  • [Presentation] DNN音声合成による嫌悪感情の表現と基礎評価2023

    • Author(s)
      俣野文義
    • Organizer
      情報処理学会音楽情報科学研究会
    • Related Report
      2023 Annual Research Report
  • [Presentation] モーラ単位で高さを制御可能な音声デザインを前提とした日本語テキスト音声合成システムの試作2023

    • Author(s)
      森勢将雅
    • Organizer
      情報処理学会音楽情報科学研究会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 日本語嫌悪感情音声の音響特徴量解析2023

    • Author(s)
      俣野文義
    • Organizer
      日本音響学会2023年秋季研究発表会
    • Related Report
      2023 Annual Research Report
  • [Presentation] リファレンスを必要としない相対的な音質評価に向けたMUSHRA法の改良について2023

    • Author(s)
      田鎖佑弥
    • Organizer
      日本音響学会2023年秋季研究発表会
    • Related Report
      2023 Annual Research Report
  • [Presentation] Coco-Nut: 自由記述文による声質制御に向けた多話者音声・声質自由記述ペアデータセット2023

    • Author(s)
      渡邊亞椰
    • Organizer
      日本音響学会2023年秋季研究発表会
    • Related Report
      2023 Annual Research Report
  • [Presentation] Are There Associations Between Voice and Color?2023

    • Author(s)
      M. Kuwa
    • Organizer
      SARMAC XIV
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Multisensory emotion perception and its cultural differences2023

    • Author(s)
      A. Tanaka
    • Organizer
      Cognitive Psychology Colloquium at Leiden University
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research / Invited
  • [Presentation] Immigration Modulates Audiovisual Emotion Integration in Adults: The Effect of the Host Culture and Migration itself2023

    • Author(s)
      A. K. Nakamura
    • Organizer
      The 21st International Multisensory Research Forum
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] The Prototypical Expressions Can Facilitate the Perception of Various Positive Emotions through Face, Voice, and Touch2023

    • Author(s)
      R. Oya
    • Organizer
      The 21st International Multisensory Research Forum
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] アンドロイドロボットによる身体・音声表現からの高次感情の知覚2023

    • Author(s)
      山本寿子
    • Organizer
      日本認知科学会第40回大会
    • Related Report
      2023 Annual Research Report
  • [Presentation] Introduction of International Society for Research on Emotion (ISRE)2023

    • Author(s)
      A. Tanaka
    • Organizer
      2023年度 人工知能学会全国大会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 薬局における男性薬剤師の身だしなみが患者の信頼感に与える影響2023

    • Author(s)
      高橋利供
    • Organizer
      日本社会薬学会第41年会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 音声合成システムの入力表現に関する分析的検討2023

    • Author(s)
      朴浚鎔
    • Organizer
      日本音響学会2023年秋季研究発表会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 表現力の異なる話者埋め込み空間と主観的話者間類似度の比較2023

    • Author(s)
      森田湧大
    • Organizer
      日本音響学会2023年秋季研究発表会
    • Related Report
      2023 Annual Research Report
  • [Presentation] Integration of Throat Microphone Recording and Bandwidth Extension for Robust Assesment of L2 Speech2023

    • Author(s)
      Yu Xu
    • Organizer
      日本音響学会2023年秋季研究発表会
    • Related Report
      2023 Annual Research Report
  • [Presentation] Emotion transfer with controllable intensity for emotional speech synthesis based on self-supervised model2023

    • Author(s)
      Wei Li
    • Organizer
      日本音響学会2023年秋季研究発表会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 知覚的話者間類似度との関連に着目した話者埋め込み空間の構成法の比較検討2023

    • Author(s)
      森田湧大
    • Organizer
      電子情報通信学会音声研究会 研究報告
    • Related Report
      2023 Annual Research Report
  • [Presentation] Improvement of Tacotron2 text-to-speech model based on masking operation and positional attention mechanism2023

    • Author(s)
      Tong Ma
    • Organizer
      電子情報通信学会音声研究会
    • Related Report
      2023 Annual Research Report
  • [Presentation] Integration of Throat Microphone Recording and Bandwidth Extension for Robust Assessment of L2 Listening2023

    • Author(s)
      Yu Xu
    • Organizer
      電子情報通信学会音声研究会
    • Related Report
      2023 Annual Research Report
  • [Presentation] Self-supervised learning model based emotion transfer and intensity control technology for expressive speech synthesis2023

    • Author(s)
      Wei Li
    • Organizer
      電子情報通信学会音声研究会
    • Related Report
      2023 Annual Research Report
  • [Presentation] タッチ,音声,および表情からのポジティブ感情の知覚2023

    • Author(s)
      大屋里佳,田中章浩
    • Organizer
      第13回多感覚研究会
    • Related Report
      2022 Annual Research Report
  • [Presentation] Visual onoma-to-wave:画像オノマトペと音源画像を利用した環境音合成の提案2023

    • Author(s)
      大中緋慧,高道慎之介,井本桂右,岡本悠希,藤井一貴,猿渡洋
    • Organizer
      電子情報通信学会技術研究報告
    • Related Report
      2022 Annual Research Report
  • [Presentation] 日本語音声合成におけるアクセント句韻律特徴量の表現と予測2023

    • Author(s)
      佐藤匡紀,高道慎之介,猿渡洋
    • Organizer
      電子情報通信学会技術研究報告
    • Related Report
      2022 Annual Research Report
  • [Presentation] 最適輸送による GMM 補間を用いた中間属性の非実在話者生成2023

    • Author(s)
      渡邊亞椰,高道慎之介,齋藤佑樹,辛徳泰,猿渡洋
    • Organizer
      日本音響学会2023年春季研究発表会
    • Related Report
      2022 Annual Research Report
  • [Presentation] 学習・評価ループを用いたデータ選択によるダークデータからの音声合成2023

    • Author(s)
      関健太郎,高道慎之介,佐伯高明,猿渡洋
    • Organizer
      日本音響学会2023年春季研究発表会
    • Related Report
      2022 Annual Research Report
  • [Presentation] 自由記述文による声質制御に向けたin-the-wild文データ収集法2023

    • Author(s)
      渡邊亞椰,高道慎之介,齋藤佑樹,猿渡洋
    • Organizer
      電子情報通信学会技術研究報告
    • Related Report
      2022 Annual Research Report
  • [Presentation] 音声モーフィングにおける時間軸方向の対応点数が品質に与える影響2023

    • Author(s)
      堀部貴紀,森勢将雅,河原英紀
    • Organizer
      日本音響学会2023年春季研究発表会
    • Related Report
      2022 Annual Research Report
  • [Presentation] 朗読音声の発話スタイルを対象とした音響特徴量解析2023

    • Author(s)
      小口純矢,森勢将雅
    • Organizer
      日本音響学会2023年春季研究発表会
    • Related Report
      2022 Annual Research Report
  • [Presentation] そのエージェントの声、合っていますか?-声質変換技術と印象適合・人工感制御-2022

    • Author(s)
      齋藤大輔
    • Organizer
      第40回日本ロボット学会学術講演会
    • Related Report
      2022 Annual Research Report
    • Invited
  • [Presentation] Domain Adaptation and Language Conditioning to Improve Phonetic Posteriorgram Based Cross-Lingual Voice Conversion2022

    • Author(s)
      P. Hsu, N. Minematsu, D. Saito
    • Organizer
      Proc. APSIPA
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research
  • [Presentation] An Experimental Study on Applying Self-Supervised Speech Representations to Cross-Lingual Voice Conversion2022

    • Author(s)
      P. Hsu, N. Minematsu, D. Saito
    • Organizer
      日本音響学会2022年秋季研究発表会
    • Related Report
      2022 Annual Research Report
  • [Presentation] LSTM-RNN音声合成における言語特徴量の時間的冗長性の削減に関する検討2022

    • Author(s)
      チェジェヒョン, 五来丈瑠, 小谷岳, 齋藤大輔, 峯松信明
    • Organizer
      情報処理学会研究報告
    • Related Report
      2022 Annual Research Report
  • [Presentation] 身体と声色からの視聴覚感情知覚の発達的変化2022

    • Author(s)
      山本寿子,田中章浩
    • Organizer
      日本心理学会第86回大会
    • Related Report
      2022 Annual Research Report
  • [Presentation] ラジオ聴取経験が及ぼす音声感情知覚への影響2022

    • Author(s)
      鍬真衣,田中章浩
    • Organizer
      日本音響学会2022年秋季研究発表会
    • Related Report
      2022 Annual Research Report
  • [Presentation] 非言語的な発声によるポジティブ感情の表出と知覚2022

    • Author(s)
      大屋里佳,田中章浩
    • Organizer
      日本音響学会2022年秋季研究発表会
    • Related Report
      2022 Annual Research Report
  • [Presentation] The perception of positive emotion from face, voice, and touch2022

    • Author(s)
      R.Oya, A. Tanaka
    • Organizer
      Proc. ISRE22
    • Related Report
      2022 Annual Research Report
  • [Presentation] 自己教師あり学習と分類器チェーンを用いた非言語的発声に対する感情識別2022

    • Author(s)
      辛徳泰,高道慎之介,猿渡洋
    • Organizer
      日本音響学会2022年秋季研究発表会
    • Related Report
      2022 Annual Research Report
  • [Presentation] 避難呼びかけ音声の持つ緊急性の分析と音声合成への適用の検討2022

    • Author(s)
      原田そら,中田亘,高道慎之介,齋藤佑樹,齋藤康之,猿渡洋
    • Organizer
      日本音響学会2022年秋季研究発表会
    • Related Report
      2022 Annual Research Report
  • [Presentation] UTMOS:VoiceMOS Challenge2022 に向けたUTokyo-Sarulab チームの自然性 MOS 予測モデル2022

    • Author(s)
      中田亘,辛德泰,佐伯高明,郡山知樹,高道慎之介,猿渡洋
    • Organizer
      日本音響学会2022年秋季研究発表会
    • Related Report
      2022 Annual Research Report
  • [Presentation] jaCappella コーパス:重唱分離・合成に向けた日本語アカペラ歌唱コーパス2022

    • Author(s)
      中村友彦,高道慎之介,丹治尚子,深山覚,猿渡洋
    • Organizer
      日本音響学会2022年秋季研究発表会
    • Related Report
      2022 Annual Research Report
  • [Presentation] 知覚に伴う音声合成に向けた機械学習とコーパス2022

    • Author(s)
      高道慎之介
    • Organizer
      日本音響学会2022年秋季研究発表会
    • Related Report
      2022 Annual Research Report
    • Invited
  • [Presentation] A practical method for generating whisper voices: Improvements in phantom silhouette method and application to multiple languages2022

    • Author(s)
      T. Uchida and M. Morise
    • Organizer
      Proc. ICA 2022
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Crazy vocoderは砕けない ~でもちょっとくだけた未来の話を~2022

    • Author(s)
      森勢将雅
    • Organizer
      電子情報通信学会技術研究報告
    • Related Report
      2022 Annual Research Report
    • Invited
  • [Presentation] 音声分析合成基盤WORLDのGUI実装と見えてきた課題2022

    • Author(s)
      河原英紀,森勢将雅
    • Organizer
      電子情報通信学会技術研究報告
    • Related Report
      2022 Annual Research Report
  • [Presentation] 変調周波数伝達特性と周波数応答で音声処理を調べよう2022

    • Author(s)
      河原英紀,矢田部浩平,榊原健,北村達也,坂野秀樹,森勢将雅
    • Organizer
      情報処理学会音楽情報科学研究会
    • Related Report
      2022 Annual Research Report
  • [Presentation] 音楽経験の有無が音高錯覚現象の知覚に与える影響の比較ー子供を対象とした結果の解析ー2022

    • Author(s)
      田鎖佑弥,森勢将雅
    • Organizer
      情報処理学会音楽情報科学研究会
    • Related Report
      2022 Annual Research Report
  • [Presentation] 声を含むデータベースの「使いやすさ」に関する一考察~No.7音声・歌唱データベース構築を実例として~2022

    • Author(s)
      森勢将雅
    • Organizer
      情報処理学会音声言語情報処理研究会
    • Related Report
      2022 Annual Research Report
  • [Presentation] 実用的なささやき声の生成法:Phantom Silhouette方式の多言語対応とユーザによる声色調整2022

    • Author(s)
      内田照久,森勢将雅
    • Organizer
      日本音響学会2022年秋季研究発表会
    • Related Report
      2022 Annual Research Report
  • [Presentation] 自動推定された音素境界とフォルマントによる音声モーフィングの品質評価2022

    • Author(s)
      堀部貴紀,森勢将雅,河原英紀
    • Organizer
      日本音響学会2022年秋季研究発表会
    • Related Report
      2022 Annual Research Report
  • [Presentation] 拡張音声モーフィングによるポップアウト属性の検証可能性2022

    • Author(s)
      河原英紀,森勢将雅,榊原健一,北村達也,牧勝弘
    • Organizer
      日本音響学会2022年秋季研究発表会
    • Related Report
      2022 Annual Research Report
  • [Presentation] プロ声優を対象とした大規模コーパス朗読におけるリテイク数の比較2022

    • Author(s)
      山本泰我,小口純矢,森勢将雅
    • Organizer
      日本音響学会2022年秋季研究発表会
    • Related Report
      2022 Annual Research Report
  • [Presentation] Speaking Rate Control by HiFi-GAN using Feature Interpolation2022

    • Author(s)
      辛徳泰,高道 慎之介,岡本拓磨,河井恒,猿渡洋
    • Organizer
      情報処理学会研究報告
    • Related Report
      2021 Annual Research Report
  • [Presentation] 画像文字からの音声合成2022

    • Author(s)
      中野嘉文,佐伯高明,高道慎之介,須藤克仁,猿渡洋
    • Organizer
      言語処理学会第28回年次大会
    • Related Report
      2021 Annual Research Report
  • [Presentation] JTubeSpeech: 音声認識と話者照合のためにYouTubeから構築される日本語音声コーパス2022

    • Author(s)
      高道慎之介,K. Ludwig,佐伯高明,塩田さやか,渡部晋治
    • Organizer
      言語処理学会第28回年次大会
    • Related Report
      2021 Annual Research Report
  • [Presentation] パラメータ最適化を用いた信号処理による仮名化手法の復号攻撃に対するロバスト性評価2022

    • Author(s)
      甲斐優人,高道慎之介,塩田さやか,貴家仁志
    • Organizer
      電子情報通信学会技術研究報告
    • Related Report
      2021 Annual Research Report
  • [Presentation] ソース・フィルタ・チャネル分解に基づく自己教師ありニューラル音声復元2022

    • Author(s)
      佐伯高明,高道慎之介,中村友彦,丹治尚子,猿渡洋
    • Organizer
      情報処理学会研究報告
    • Related Report
      2021 Annual Research Report
  • [Presentation] タッチや音声による感情知覚2022

    • Author(s)
      大屋里佳,田中章浩
    • Organizer
      第12回多感覚研究会
    • Related Report
      2021 Annual Research Report
  • [Presentation] WORLDに基づく時変多属性任意事例数モーフィングと周辺ツールの実装について2022

    • Author(s)
      河原英紀,森勢将雅
    • Organizer
      日本音響学会2022年春季研究発表会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 複素ケプストラムに基づく音源の位相特性を用いた音声波形生成2022

    • Author(s)
      小口純矢,森勢将雅
    • Organizer
      日本音響学会2022年春季研究発表会
    • Related Report
      2021 Annual Research Report
  • [Presentation] テキスト音声合成に向けたモーラバランス型コーパスの提案と評価2022

    • Author(s)
      森勢将雅
    • Organizer
      日本音響学会2022年春季研究発表会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 音高錯覚現象における大人と子供の比較2022

    • Author(s)
      田鎖佑弥,森勢将雅
    • Organizer
      日本音響学会2022年春季研究発表会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 基本周波数変化に伴うスペクトルの動的変動を考慮した自然性を維持できる音高変換の検討2022

    • Author(s)
      金井郁也,森勢将雅
    • Organizer
      日本音響学会2022年春季研究発表会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 音声仮名化のための加工音声重畳と非可逆性評価2021

    • Author(s)
      甲斐優人,高道慎之介,塩田さやか,貴家仁志
    • Organizer
      日本音響学会2021年秋季研究発表会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 魅力的な音声に影響する音響特徴の検討2021

    • Author(s)
      和田夏美,大屋里佳,長島太郎,小池貴久,田中章浩
    • Organizer
      第23回日本感性工学会大会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 自己の発話に対する他人声のフィードバックが声の所有感に与える影響2021

    • Author(s)
      中川優奈,田中章浩
    • Organizer
      日本音響学会2021年秋季研究発表会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 自分と他人の声の境界は変化するか2021

    • Author(s)
      中川優奈,田中章浩
    • Organizer
      電子情報通信学会ヒューマン情報処理研究会
    • Related Report
      2021 Annual Research Report
  • [Presentation] ITAコーパス:パブリックドメインの音素バランス文からなる日本語テキストコーパスの構築と基礎評価2021

    • Author(s)
      小口純矢,金井郁也,小田恭央,齊藤剛史,森勢将雅
    • Organizer
      情報処理学会音楽情報科学研究会
    • Related Report
      2021 Annual Research Report
  • [Presentation] レアなモーラを含む日本語歌唱データベースの構築と基礎評価2021

    • Author(s)
      森勢将雅,藤本健,小岩井ことり
    • Organizer
      第20回情報科学技術フォーラム
    • Related Report
      2021 Annual Research Report
  • [Presentation] 声帯音源の群遅延特性に基づく特徴量を用いた励振源による有声音波形生成法の提案と評価2021

    • Author(s)
      小口純矢,森勢将雅
    • Organizer
      日本音響学会2021年秋季研究発表会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 音声分析合成システムの無声音生成に用いる励起信号の違いが分析合成音の品質劣化に与える影響の調査2021

    • Author(s)
      田鎖佑弥,森勢将雅
    • Organizer
      日本音響学会2021年秋季研究発表会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 歌声の基本周波数変化に伴う音色変化に対応する動的変動量の解析2021

    • Author(s)
      金井郁也,森勢将雅
    • Organizer
      日本音響学会2021年秋季研究発表会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 波形の相互相関に基づく基本周波数推定における距離尺度による影響の調査2021

    • Author(s)
      小口純矢,森勢将雅
    • Organizer
      日本音響学会2021年秋季研究発表会
    • Related Report
      2021 Annual Research Report
  • [Presentation] Interactive and Real-Time Acoustic Measurement Tools for Speech Data Acquisition and Presentation: Application of an Extended Member of Time Stretched Pulses2021

    • Author(s)
      Kawahara, H., Yatabe, K., Sakakibara, K.-I., Mizumachi, M., Morise, M., Banno, H., Irino, T.
    • Organizer
      Interspeech 2021
    • Related Report
      2021 Annual Research Report
  • [Presentation] IMPLEMENTATION OF INTERACTIVE TOOLS FOR INVESTIGATING FUNDAMENTAL FREQUENCY RESPONSE OF VOICED SOUNDS TO AUDITORY STIMULATION2021

    • Author(s)
      H. Kawahara, T. Irino, T. Matsui, K. Yatabe, K. Sakakibara, M. Tsuzaki, M. Morise
    • Organizer
      APSIPA 2021
    • Related Report
      2021 Annual Research Report
  • [Presentation] スペクトル差異に着目した単独歌唱音声の合唱への最適化の検討2021

    • Author(s)
      稲津遥太郎,齋藤大輔,峯松信明
    • Organizer
      情報処理学会研究報告
    • Related Report
      2021 Annual Research Report
  • [Presentation] 固有声変換法を用いた重唱における調和度制御に関する検討2021

    • Author(s)
      菊地晏南,齋藤大輔,峯松信明
    • Organizer
      情報処理学会研究報告
    • Related Report
      2021 Annual Research Report
  • [Presentation] 自然な斉唱音声合成のための複数歌唱者の基本周波数パターン制御に関する検討2021

    • Author(s)
      勝瑞雄介,齋藤大輔,峯松信明
    • Organizer
      情報処理学会研究報告
    • Related Report
      2021 Annual Research Report
  • [Presentation] A fine-grained prosody control approach for improving the diversity of emotional text-to-speech2021

    • Author(s)
      J. Zhang,D. Saito,N. Minematsu
    • Organizer
      日本音響学会2021年秋季研究発表会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 統計的音声合成のための非負値自己符号化器を用いた音響モデリングの検討2021

    • Author(s)
      五来丈瑠,齋藤大輔,峯松信明
    • Organizer
      日本音響学会2021年秋季研究発表会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 自然音声の人工感を連続的に制御する技術の検討と評価2021

    • Author(s)
      今村奏海,増田尚建,須田仁志,齋藤大輔,峯松信明
    • Organizer
      日本音響学会2021年秋季研究発表会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 対話型遺伝的アルゴリズムを用いた自己聴取音合成のためのパラメータ推定2021

    • Author(s)
      田中尚輝,増田尚建,齋藤大輔,峯松信明
    • Organizer
      日本音響学会2021年秋季研究発表会
    • Related Report
      2021 Annual Research Report
  • [Presentation] An Experimental Study on Language Conditioning in Phonetic Posteriorgrams based Cross-lingual Voice Conversion2021

    • Author(s)
      P. Hsu,N. Minematsu,D. Saito
    • Organizer
      日本音響学会2021年秋季研究発表会
    • Related Report
      2021 Annual Research Report
  • [Book] 顔を聞き、声を見る2022

    • Author(s)
      日本認知科学会、田中 章浩
    • Total Pages
      268
    • Publisher
      共立出版
    • ISBN
      4320094697
    • Related Report
      2022 Annual Research Report
  • [Remarks] 自由記述文による声質制御に向けた多話者音声・声質自由記述ペアデータセット

    • URL

      https://sites.google.com/site/shinnosuketakamichi/research-topics/coconut_corpus

    • Related Report
      2023 Annual Research Report
  • [Remarks] jaCappellaコーパス

    • URL

      https://tomohikonakamura.github.io/jaCappella_corpus/

    • Related Report
      2023 Annual Research Report
  • [Remarks] 研究者向け音声合成検証用No.7音声データベース

    • URL

      https://voiceseven.com/7rdev/login.php

    • Related Report
      2021 Annual Research Report
  • [Remarks] ROHAN:モーラバランス型日本語コーパス

    • URL

      https://github.com/mmorise/rohan4600

    • Related Report
      2021 Annual Research Report
  • [Remarks] ITAコーパス

    • URL

      https://github.com/mmorise/ita-corpus

    • Related Report
      2021 Annual Research Report

URL: 

Published: 2021-04-28   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi