ビスポーク音声デザインの骨格形成と体系化

Research Project

Project/Area Number	21H04900
Research Category	Grant-in-Aid for Scientific Research (A)
Allocation Type	Single-year Grants
Section	一般
Review Section	Medium-sized Section 61:Human informatics and related fields
Research Institution	Meiji University
Principal Investigator	森勢将雅明治大学, 総合数理学部, 専任准教授 (60510013)
Co-Investigator(Kenkyū-buntansha)	田中章浩東京女子大学, 現代教養学部, 教授 (80396530) 齋藤大輔東京大学, 大学院工学系研究科(工学部), 准教授 (40615150) 高道慎之介東京大学, 大学院情報理工学系研究科, 助教 (90784330)
Project Period (FY)	2021-04-05 – 2025-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥42,770,000 (Direct Cost: ¥32,900,000、Indirect Cost: ¥9,870,000) Fiscal Year 2024: ¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000) Fiscal Year 2023: ¥6,370,000 (Direct Cost: ¥4,900,000、Indirect Cost: ¥1,470,000) Fiscal Year 2022: ¥11,050,000 (Direct Cost: ¥8,500,000、Indirect Cost: ¥2,550,000) Fiscal Year 2021: ¥20,670,000 (Direct Cost: ¥15,900,000、Indirect Cost: ¥4,770,000)
Keywords	音声・歌声情報処理 / 音声デザイン / 声質変換 / 音声知覚 / 音声情報処理 / 音声合成
Outline of Research at the Start	最先端のテキスト音声合成は人間とほぼ等価な音声を合成可能であり，すでにスマートスピーカなどで利用されている．一方，同じテキストでも状況により表現を柔軟に加工できる技術は，主にコンテンツ制作の領域において需要がある．本研究は，音声合成研究の新たな方向性として，計算機があたかも職人のようにユーザと共同し，ユーザの音声デザインを助ける技術開発を目指す．心理学分野と連携し，テキスト音声合成や声質変換に適した音声制御のための心理パラメータを明らかにする．ユーザが大まかにデザインした結果を計算機が微調整し，自然な音声を合成する一連の技術を「ビスポーク音声デザイン」として体系化することが狙いである．
Outline of Annual Research Achievements	2022年度は，2021年度に構築した音声データベースを用いて発話スタイルの音響特徴解析を行う研究や，音声デザインインタフェース開発を目指したGUIの試作，および様々な特徴を有する音声合成技術の研究等多面的な活動に取り組んだ．音声データベース用いたテキスト音声合成を実装することで，Deep learningベースの方法を用いた場合でも，データベースの量・質ともに問題が無いことを確認した．その後，音声デザインを重視した技術の実現を目指し，従来法の改良に取り組んだ．加えて，声優が意図的に変化させた発話スタイルが，音声の基本周波数やフォルマント周波数，および話速に影響を与えていることを確認した．コーパスの読みやすさを評価するため，2名の声優に4,600文のコーパスを朗読させ，全文のリテイク回数を記録し比較することで朗読が困難な文が無いか評価した．評価の結果，共通する文でリテイク数が増加する傾向は認められず，一文を構成するモーラ数とリテイク数が比例する傾向を確認した．音声分析や合成に関する研究では，避難呼びかけの音声の分析や合成，2話者の中間属性を有する音声の合成技術，およびささやき声の生成法などの実現を目指した研究を推進した．加えて，声質変換技術にも取り組み，Deep neural networks (DNN)による声質変換技術について論文を発表した．音声知覚についても，音声に対して知覚するポジティブ感情，および音声のみならず感情も含めた感情知覚に関する研究を推進した．音声デザインGUIについては，研究代表者の代表的な成果である音声分析合成基盤WORLDをGUIとして実装し，音声デザインインタフェース開発に向けた問題点の洗い出しに取り組んだ．現状では高さ（基本周波数）など物理量で近似できるパラメータの制御に絞り，柔軟に操作できることを優先してプロトタイプを実装した．
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 対面での主観評価の実施も滞りなくできるようになりつつあり，コロナ禍によりオンライン化を余儀なくされていた実験等の遅延問題はほぼ解消した．音声分析，合成，知覚，デザインに関する幅広い取り組みを実施しており，概ね順調な成果を上げつつあると評価している．
Strategy for Future Research Activity	引き続き，様々な感性情報を有する音声の分析，合成，知覚に関する研究を進める．加えて，音声デザインについては，目的とするビスポークデザインを実現するプロトタイプの研究開発に取り組む．具体的には，ユーザが厳密ではないリクエストを提示し，計算機がそこからリクエストを反映させて自然な音声を生成する技術の開発を目指す．デザインすべきパラメータ等は無数にあるため，ここでは基本周波数を対象とし，点ピッチパターンの考え方をデザインに取り入れることを目指す．

Report

(3 results)

Research Products

(82 results)

All 2023 2022 2021 Other

All Journal Article (16 results) (of which Peer Reviewed: 16 results, Open Access: 13 results) Presentation (62 results) (of which Int'l Joint Research: 2 results, Invited: 3 results) Book (1 results) Remarks (3 results)

[Journal Article] Touch and voice have different advantages in perceiving positive and negative emotions2023
- Author(s)
  Oya Rika、Tanaka Akihiro
- Journal Title
  
  i-Perception
  
  Volume: 14 Issue: 2 Pages: 1-12
- DOI
  10.1177/20416695231160420
- Related Report
  2022 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] VTTS: Visual-Text To Speech2023
- Author(s)
  Nakano Yoshifumi、Saeki Takaaki、Takamichi Shinnosuke、Sudoh Katsuhito、Saruwatari Hiroshi
- Journal Title
  
  IEEE SLT
  
  Volume: － Pages: 936-942
- DOI
  10.1109/slt54892.2023.10022739
- Related Report
  2022 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] ROHAN: A mora-balanced Japanese text corpus for text-to-speech synthesis2022
- Author(s)
  森勢将雅
- Journal Title
  
  THE JOURNAL OF THE ACOUSTICAL SOCIETY OF JAPAN
  
  Volume: 79 Issue: 1 Pages: 9-17
- DOI
  10.20697/jasj.79.1_9
- ISSN
  0369-4232, 2432-2040
- Year and Date
  2022-12-25
- Related Report
  2022 Annual Research Report
- Peer Reviewed
[Journal Article] Building a Japanese Singing Database Including Rare Moras and Its Evaluation2022
- Author(s)
  森勢将雅、藤本健、小岩井ことり
- Journal Title
  
  情報処理学会論文誌
  
  Volume: 63 Issue: 9 Pages: 1523-1531
- DOI
  10.20729/00220098
- Year and Date
  2022-09-15
- Related Report
  2022 Annual Research Report
- Peer Reviewed
[Journal Article] The interaction of emotional information from the voice and touch2022
- Author(s)
  Oya Rika、Tanaka Akihiro
- Journal Title
  
  Acoustical Science and Technology
  
  Volume: 43 Issue: 5 Pages: 291-293
- DOI
  10.1250/ast.43.291
- ISSN
  0369-4232, 1346-3969, 1347-5177
- Year and Date
  2022-09-01
- Related Report
  2022 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] INmfCA Algorithm for Training of Nonparallel Voice Conversion Systems Based on Non-Negative Matrix Factorization2022
- Author(s)
  SUDA Hitoshi、KOTANI Gaku、SAITO Daisuke
- Journal Title
  
  IEICE Transactions on Information and Systems
  
  Volume: E105.D Issue: 6 Pages: 1196-1210
- DOI
  10.1587/transinf.2021EDP7234
- ISSN
  0916-8532, 1745-1361
- Year and Date
  2022-06-01
- Related Report
  2022 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] Voice Conversion Based on Deep Neural Networks for Time-Variant Linear Transformations2022
- Author(s)
  Kotani Gaku、Saito Daisuke、Minematsu Nobuaki
- Journal Title
  
  IEEE/ACM Transactions on Audio, Speech, and Language Processing
  
  Volume: 30 Pages: 2981-2992
- DOI
  10.1109/taslp.2022.3205755
- Related Report
  2022 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] Text-to-speech synthesis using spectral modeling based on non-negative autoencoder2022
- Author(s)
  Gorai Takeru、Saito Daisuke、Minematsu Nobuaki
- Journal Title
  
  Proc. INTERSPEECH 2022
  
  Volume: － Pages: 1621-1625
- DOI
  10.21437/interspeech.2022-10290
- Related Report
  2022 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] UTMOS: UTokyo-SaruLab System for VoiceMOS Challenge 20222022
- Author(s)
  Saeki Takaaki、Xin Detai、Nakata Wataru、Koriyama Tomoki、Takamichi Shinnosuke、Saruwatari Hiroshi
- Journal Title
  
  Proc. INTERSPEECH 2022
  
  Volume: － Pages: 4521-4525
- DOI
  10.21437/interspeech.2022-439
- Related Report
  2022 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] J-MAC: Japanese multi-speaker audiobook corpus for speech synthesis2022
- Author(s)
  Takamichi Shinnosuke、Nakata Wataru、Tanji Naoko、Saruwatari Hiroshi
- Journal Title
  
  Proc. INTERSPEECH 2022
  
  Volume: － Pages: 2358-2362
- DOI
  10.21437/interspeech.2022-444
- Related Report
  2022 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] SelfRemaster: Self-Supervised Speech Restoration with Analysis-by-Synthesis Approach Using Channel Modeling2022
- Author(s)
  Saeki Takaaki、Takamichi Shinnosuke、Nakamura Tomohiko、Tanji Naoko、Saruwatari Hiroshi
- Journal Title
  
  Proc. INTERSPEECH 2022
  
  Volume: － Pages: 4406-4410
- DOI
  10.21437/interspeech.2022-298
- Related Report
  2022 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] Exploring the Effectiveness of Self-supervised Learning and Classifier Chains in Emotion Recognition of Nonverbal Vocalizations2022
- Author(s)
  Detai Xin, Shinnosuke Takamichi, and Saruwatari Hiroshi
- Journal Title
  
  Proc. ICML ExVo Workshop
  
  Volume: －
- Related Report
  2022 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] An objective test tool for pitch extractors' response attributes2022
- Author(s)
  Kawahara Hideki、Yatabe Kohei、Sakakibara Ken-Ichi、Kitamura Tatsuya、Banno Hideki、Morise Masanori
- Journal Title
  
  Proc. INTERSPEECH 2022
  
  Volume: － Pages: 659-663
- DOI
  10.21437/interspeech.2022-800
- Related Report
  2022 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] Cross-cultural similarity and cultural specificity in the emotion perception from touch. Emotion.2022
- Author(s)
  Oya, R. & Tanaka, A.
- Journal Title
  
  Emotion
  
  Volume: - Issue: 5 Pages: 1400-1409
- DOI
  10.1037/emo0001086
- Related Report
  2021 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] 顔・身体表現から探るトランスカルチャー2021
- Author(s)
  田中章浩，清水大地，小手川正二郎
- Journal Title
  
  映像情報メディア学会誌
  
  Volume: 75 Pages: 614-620
- NAID
  40022689419
- Related Report
  2021 Annual Research Report
- Peer Reviewed
[Journal Article] Mixture of Orthogonal Sequences Made from Extended Time-Stretched Pulses Enables Measurement of Involuntary Voice Fundamental Frequency Response to Pitch Perturbation2021
- Author(s)
  H. Kawahara, T. Matsui, K. Yatabe, K.-I. Sakakibara, M. Tsuzaki, M. Morise, T. Irino
- Journal Title
  
  Proc. Interspeech 2021
  
  Volume: -- Pages: 3206-3210
- DOI
  10.21437/interspeech.2021-2073
- Related Report
  2021 Annual Research Report
- Peer Reviewed / Open Access
[Presentation] タッチ，音声，および表情からのポジティブ感情の知覚2023
- Author(s)
  大屋里佳，田中章浩
- Organizer
  第13回多感覚研究会
- Related Report
  2022 Annual Research Report
[Presentation] Visual onoma-to-wave：画像オノマトペと音源画像を利用した環境音合成の提案2023
- Author(s)
  大中緋慧，高道慎之介，井本桂右，岡本悠希，藤井一貴，猿渡洋
- Organizer
  電子情報通信学会技術研究報告
- Related Report
  2022 Annual Research Report
[Presentation] 日本語音声合成におけるアクセント句韻律特徴量の表現と予測2023
- Author(s)
  佐藤匡紀，高道慎之介，猿渡洋
- Organizer
  電子情報通信学会技術研究報告
- Related Report
  2022 Annual Research Report
[Presentation] 最適輸送による GMM 補間を用いた中間属性の非実在話者生成2023
- Author(s)
  渡邊亞椰，高道慎之介，齋藤佑樹，辛徳泰，猿渡洋
- Organizer
  日本音響学会2023年春季研究発表会
- Related Report
  2022 Annual Research Report
[Presentation] 学習・評価ループを用いたデータ選択によるダークデータからの音声合成2023
- Author(s)
  関健太郎，高道慎之介，佐伯高明，猿渡洋
- Organizer
  日本音響学会2023年春季研究発表会
- Related Report
  2022 Annual Research Report
[Presentation] 自由記述文による声質制御に向けたin-the-wild文データ収集法2023
- Author(s)
  渡邊亞椰，高道慎之介，齋藤佑樹，猿渡洋
- Organizer
  電子情報通信学会技術研究報告
- Related Report
  2022 Annual Research Report
[Presentation] 音声モーフィングにおける時間軸方向の対応点数が品質に与える影響2023
- Author(s)
  堀部貴紀，森勢将雅，河原英紀
- Organizer
  日本音響学会2023年春季研究発表会
- Related Report
  2022 Annual Research Report
[Presentation] 朗読音声の発話スタイルを対象とした音響特徴量解析2023
- Author(s)
  小口純矢，森勢将雅
- Organizer
  日本音響学会2023年春季研究発表会
- Related Report
  2022 Annual Research Report
[Presentation] そのエージェントの声、合っていますか？-声質変換技術と印象適合・人工感制御-2022
- Author(s)
  齋藤大輔
- Organizer
  第40回日本ロボット学会学術講演会
- Related Report
  2022 Annual Research Report
- Invited
[Presentation] Domain Adaptation and Language Conditioning to Improve Phonetic Posteriorgram Based Cross-Lingual Voice Conversion2022
- Author(s)
  P. Hsu, N. Minematsu, D. Saito
- Organizer
  Proc. APSIPA
- Related Report
  2022 Annual Research Report
- Int'l Joint Research
[Presentation] An Experimental Study on Applying Self-Supervised Speech Representations to Cross-Lingual Voice Conversion2022
- Author(s)
  P. Hsu, N. Minematsu, D. Saito
- Organizer
  日本音響学会2022年秋季研究発表会
- Related Report
  2022 Annual Research Report
[Presentation] LSTM-RNN音声合成における言語特徴量の時間的冗長性の削減に関する検討2022
- Author(s)
  チェジェヒョン, 五来丈瑠, 小谷岳, 齋藤大輔, 峯松信明
- Organizer
  情報処理学会研究報告
- Related Report
  2022 Annual Research Report
[Presentation] 身体と声色からの視聴覚感情知覚の発達的変化2022
- Author(s)
  山本寿子，田中章浩
- Organizer
  日本心理学会第86回大会
- Related Report
  2022 Annual Research Report
[Presentation] ラジオ聴取経験が及ぼす音声感情知覚への影響2022
- Author(s)
  鍬真衣，田中章浩
- Organizer
  日本音響学会2022年秋季研究発表会
- Related Report
  2022 Annual Research Report
[Presentation] 非言語的な発声によるポジティブ感情の表出と知覚2022
- Author(s)
  大屋里佳，田中章浩
- Organizer
  日本音響学会2022年秋季研究発表会
- Related Report
  2022 Annual Research Report
[Presentation] The perception of positive emotion from face, voice, and touch2022
- Author(s)
  R.Oya, A. Tanaka
- Organizer
  Proc. ISRE22
- Related Report
  2022 Annual Research Report
[Presentation] 自己教師あり学習と分類器チェーンを用いた非言語的発声に対する感情識別2022
- Author(s)
  辛徳泰，高道慎之介，猿渡洋
- Organizer
  日本音響学会2022年秋季研究発表会
- Related Report
  2022 Annual Research Report
[Presentation] 避難呼びかけ音声の持つ緊急性の分析と音声合成への適用の検討2022
- Author(s)
  原田そら，中田亘，高道慎之介，齋藤佑樹，齋藤康之，猿渡洋
- Organizer
  日本音響学会2022年秋季研究発表会
- Related Report
  2022 Annual Research Report
[Presentation] UTMOS：VoiceMOS Challenge2022 に向けたUTokyo-Sarulab チームの自然性 MOS 予測モデル2022
- Author(s)
  中田亘，辛德泰，佐伯高明，郡山知樹，高道慎之介，猿渡洋
- Organizer
  日本音響学会2022年秋季研究発表会
- Related Report
  2022 Annual Research Report
[Presentation] jaCappella コーパス：重唱分離・合成に向けた日本語アカペラ歌唱コーパス2022
- Author(s)
  中村友彦，高道慎之介，丹治尚子，深山覚，猿渡洋
- Organizer
  日本音響学会2022年秋季研究発表会
- Related Report
  2022 Annual Research Report
[Presentation] 知覚に伴う音声合成に向けた機械学習とコーパス2022
- Author(s)
  高道慎之介
- Organizer
  日本音響学会2022年秋季研究発表会
- Related Report
  2022 Annual Research Report
- Invited
[Presentation] A practical method for generating whisper voices: Improvements in phantom silhouette method and application to multiple languages2022
- Author(s)
  T. Uchida and M. Morise
- Organizer
  Proc. ICA 2022
- Related Report
  2022 Annual Research Report
- Int'l Joint Research
[Presentation] Crazy vocoderは砕けない～でもちょっとくだけた未来の話を～2022
- Author(s)
  森勢将雅
- Organizer
  電子情報通信学会技術研究報告
- Related Report
  2022 Annual Research Report
- Invited
[Presentation] 音声分析合成基盤WORLDのGUI実装と見えてきた課題2022
- Author(s)
  河原英紀，森勢将雅
- Organizer
  電子情報通信学会技術研究報告
- Related Report
  2022 Annual Research Report
[Presentation] 変調周波数伝達特性と周波数応答で音声処理を調べよう2022
- Author(s)
  河原英紀，矢田部浩平，榊原健，北村達也，坂野秀樹，森勢将雅
- Organizer
  情報処理学会音楽情報科学研究会
- Related Report
  2022 Annual Research Report
[Presentation] 音楽経験の有無が音高錯覚現象の知覚に与える影響の比較ー子供を対象とした結果の解析ー2022
- Author(s)
  田鎖佑弥，森勢将雅
- Organizer
  情報処理学会音楽情報科学研究会
- Related Report
  2022 Annual Research Report
[Presentation] 声を含むデータベースの「使いやすさ」に関する一考察～No.7音声・歌唱データベース構築を実例として～2022
- Author(s)
  森勢将雅
- Organizer
  情報処理学会音声言語情報処理研究会
- Related Report
  2022 Annual Research Report
[Presentation] 実用的なささやき声の生成法：Phantom Silhouette方式の多言語対応とユーザによる声色調整2022
- Author(s)
  内田照久，森勢将雅
- Organizer
  日本音響学会2022年秋季研究発表会
- Related Report
  2022 Annual Research Report
[Presentation] 自動推定された音素境界とフォルマントによる音声モーフィングの品質評価2022
- Author(s)
  堀部貴紀，森勢将雅，河原英紀
- Organizer
  日本音響学会2022年秋季研究発表会
- Related Report
  2022 Annual Research Report
[Presentation] 拡張音声モーフィングによるポップアウト属性の検証可能性2022
- Author(s)
  河原英紀，森勢将雅，榊原健一，北村達也，牧勝弘
- Organizer
  日本音響学会2022年秋季研究発表会
- Related Report
  2022 Annual Research Report
[Presentation] プロ声優を対象とした大規模コーパス朗読におけるリテイク数の比較2022
- Author(s)
  山本泰我，小口純矢，森勢将雅
- Organizer
  日本音響学会2022年秋季研究発表会
- Related Report
  2022 Annual Research Report
[Presentation] Speaking Rate Control by HiFi-GAN using Feature Interpolation2022
- Author(s)
  辛徳泰，高道慎之介，岡本拓磨，河井恒，猿渡洋
- Organizer
  情報処理学会研究報告
- Related Report
  2021 Annual Research Report
[Presentation] 画像文字からの音声合成2022
- Author(s)
  中野嘉文，佐伯高明，高道慎之介，須藤克仁，猿渡洋
- Organizer
  言語処理学会第28回年次大会
- Related Report
  2021 Annual Research Report
[Presentation] JTubeSpeech: 音声認識と話者照合のためにYouTubeから構築される日本語音声コーパス2022
- Author(s)
  高道慎之介，K. Ludwig，佐伯高明，塩田さやか，渡部晋治
- Organizer
  言語処理学会第28回年次大会
- Related Report
  2021 Annual Research Report
[Presentation] パラメータ最適化を用いた信号処理による仮名化手法の復号攻撃に対するロバスト性評価2022
- Author(s)
  甲斐優人，高道慎之介，塩田さやか，貴家仁志
- Organizer
  電子情報通信学会技術研究報告
- Related Report
  2021 Annual Research Report
[Presentation] ソース・フィルタ・チャネル分解に基づく自己教師ありニューラル音声復元2022
- Author(s)
  佐伯高明，高道慎之介，中村友彦，丹治尚子，猿渡洋
- Organizer
  情報処理学会研究報告
- Related Report
  2021 Annual Research Report
[Presentation] タッチや音声による感情知覚2022
- Author(s)
  大屋里佳，田中章浩
- Organizer
  第12回多感覚研究会
- Related Report
  2021 Annual Research Report
[Presentation] WORLDに基づく時変多属性任意事例数モーフィングと周辺ツールの実装について2022
- Author(s)
  河原英紀，森勢将雅
- Organizer
  日本音響学会2022年春季研究発表会
- Related Report
  2021 Annual Research Report
[Presentation] 複素ケプストラムに基づく音源の位相特性を用いた音声波形生成2022
- Author(s)
  小口純矢，森勢将雅
- Organizer
  日本音響学会2022年春季研究発表会
- Related Report
  2021 Annual Research Report
[Presentation] テキスト音声合成に向けたモーラバランス型コーパスの提案と評価2022
- Author(s)
  森勢将雅
- Organizer
  日本音響学会2022年春季研究発表会
- Related Report
  2021 Annual Research Report
[Presentation] 音高錯覚現象における大人と子供の比較2022
- Author(s)
  田鎖佑弥，森勢将雅
- Organizer
  日本音響学会2022年春季研究発表会
- Related Report
  2021 Annual Research Report
[Presentation] 基本周波数変化に伴うスペクトルの動的変動を考慮した自然性を維持できる音高変換の検討2022
- Author(s)
  金井郁也，森勢将雅
- Organizer
  日本音響学会2022年春季研究発表会
- Related Report
  2021 Annual Research Report
[Presentation] 音声仮名化のための加工音声重畳と非可逆性評価2021
- Author(s)
  甲斐優人，高道慎之介，塩田さやか，貴家仁志
- Organizer
  日本音響学会2021年秋季研究発表会
- Related Report
  2021 Annual Research Report
[Presentation] 魅力的な音声に影響する音響特徴の検討2021
- Author(s)
  和田夏美，大屋里佳，長島太郎，小池貴久，田中章浩
- Organizer
  第23回日本感性工学会大会
- Related Report
  2021 Annual Research Report
[Presentation] 自己の発話に対する他人声のフィードバックが声の所有感に与える影響2021
- Author(s)
  中川優奈，田中章浩
- Organizer
  日本音響学会2021年秋季研究発表会
- Related Report
  2021 Annual Research Report
[Presentation] 自分と他人の声の境界は変化するか2021
- Author(s)
  中川優奈，田中章浩
- Organizer
  電子情報通信学会ヒューマン情報処理研究会
- Related Report
  2021 Annual Research Report
[Presentation] ITAコーパス：パブリックドメインの音素バランス文からなる日本語テキストコーパスの構築と基礎評価2021
- Author(s)
  小口純矢，金井郁也，小田恭央，齊藤剛史，森勢将雅
- Organizer
  情報処理学会音楽情報科学研究会
- Related Report
  2021 Annual Research Report
[Presentation] レアなモーラを含む日本語歌唱データベースの構築と基礎評価2021
- Author(s)
  森勢将雅，藤本健，小岩井ことり
- Organizer
  第20回情報科学技術フォーラム
- Related Report
  2021 Annual Research Report
[Presentation] 声帯音源の群遅延特性に基づく特徴量を用いた励振源による有声音波形生成法の提案と評価2021
- Author(s)
  小口純矢，森勢将雅
- Organizer
  日本音響学会2021年秋季研究発表会
- Related Report
  2021 Annual Research Report
[Presentation] 音声分析合成システムの無声音生成に用いる励起信号の違いが分析合成音の品質劣化に与える影響の調査2021
- Author(s)
  田鎖佑弥，森勢将雅
- Organizer
  日本音響学会2021年秋季研究発表会
- Related Report
  2021 Annual Research Report
[Presentation] 歌声の基本周波数変化に伴う音色変化に対応する動的変動量の解析2021
- Author(s)
  金井郁也，森勢将雅
- Organizer
  日本音響学会2021年秋季研究発表会
- Related Report
  2021 Annual Research Report
[Presentation] 波形の相互相関に基づく基本周波数推定における距離尺度による影響の調査2021
- Author(s)
  小口純矢，森勢将雅
- Organizer
  日本音響学会2021年秋季研究発表会
- Related Report
  2021 Annual Research Report
[Presentation] Interactive and Real-Time Acoustic Measurement Tools for Speech Data Acquisition and Presentation: Application of an Extended Member of Time Stretched Pulses2021
- Author(s)
  Kawahara, H., Yatabe, K., Sakakibara, K.-I., Mizumachi, M., Morise, M., Banno, H., Irino, T.
- Organizer
  Interspeech 2021
- Related Report
  2021 Annual Research Report
[Presentation] IMPLEMENTATION OF INTERACTIVE TOOLS FOR INVESTIGATING FUNDAMENTAL FREQUENCY RESPONSE OF VOICED SOUNDS TO AUDITORY STIMULATION2021
- Author(s)
  H. Kawahara, T. Irino, T. Matsui, K. Yatabe, K. Sakakibara, M. Tsuzaki, M. Morise
- Organizer
  APSIPA 2021
- Related Report
  2021 Annual Research Report
[Presentation] スペクトル差異に着目した単独歌唱音声の合唱への最適化の検討2021
- Author(s)
  稲津遥太郎，齋藤大輔，峯松信明
- Organizer
  情報処理学会研究報告
- Related Report
  2021 Annual Research Report
[Presentation] 固有声変換法を用いた重唱における調和度制御に関する検討2021
- Author(s)
  菊地晏南，齋藤大輔，峯松信明
- Organizer
  情報処理学会研究報告
- Related Report
  2021 Annual Research Report
[Presentation] 自然な斉唱音声合成のための複数歌唱者の基本周波数パターン制御に関する検討2021
- Author(s)
  勝瑞雄介，齋藤大輔，峯松信明
- Organizer
  情報処理学会研究報告
- Related Report
  2021 Annual Research Report
[Presentation] A fine-grained prosody control approach for improving the diversity of emotional text-to-speech2021
- Author(s)
  J. Zhang，D. Saito，N. Minematsu
- Organizer
  日本音響学会2021年秋季研究発表会
- Related Report
  2021 Annual Research Report
[Presentation] 統計的音声合成のための非負値自己符号化器を用いた音響モデリングの検討2021
- Author(s)
  五来丈瑠，齋藤大輔，峯松信明
- Organizer
  日本音響学会2021年秋季研究発表会
- Related Report
  2021 Annual Research Report
[Presentation] 自然音声の人工感を連続的に制御する技術の検討と評価2021
- Author(s)
  今村奏海，増田尚建，須田仁志，齋藤大輔，峯松信明
- Organizer
  日本音響学会2021年秋季研究発表会
- Related Report
  2021 Annual Research Report
[Presentation] 対話型遺伝的アルゴリズムを用いた自己聴取音合成のためのパラメータ推定2021
- Author(s)
  田中尚輝，増田尚建，齋藤大輔，峯松信明
- Organizer
  日本音響学会2021年秋季研究発表会
- Related Report
  2021 Annual Research Report
[Presentation] An Experimental Study on Language Conditioning in Phonetic Posteriorgrams based Cross-lingual Voice Conversion2021
- Author(s)
  P. Hsu，N. Minematsu，D. Saito
- Organizer
  日本音響学会2021年秋季研究発表会
- Related Report
  2021 Annual Research Report
[Book] 顔を聞き、声を見る2022
- Author(s)
  日本認知科学会、田中章浩
- Total Pages
  268
- Publisher
  共立出版
- ISBN
  4320094697
- Related Report
  2022 Annual Research Report
[Remarks] 研究者向け音声合成検証用No.7音声データベース
- URL
  https://voiceseven.com/7rdev/login.php
- Related Report
  2021 Annual Research Report
[Remarks] ROHAN：モーラバランス型日本語コーパス
- URL
  https://github.com/mmorise/rohan4600
- Related Report
  2021 Annual Research Report
[Remarks] ITAコーパス
- URL
  https://github.com/mmorise/ita-corpus
- Related Report
  2021 Annual Research Report

ビスポーク音声デザインの骨格形成と体系化

Principal Investigator

森勢 将雅 明治大学, 総合数理学部, 専任准教授 (60510013)

¥42,770,000 (Direct Cost: ¥32,900,000、Indirect Cost: ¥9,870,000)

Current Status of Research Progress

Reason

Report

Research Products

[Journal Article] Touch and voice have different advantages in perceiving positive and negative emotions2023

Author(s)

Journal Title

DOI

Related Report

[Journal Article] VTTS: Visual-Text To Speech2023

Author(s)

Journal Title

DOI

Related Report

[Journal Article] ROHAN: A mora-balanced Japanese text corpus for text-to-speech synthesis2022

Author(s)

Journal Title

DOI

ISSN

Year and Date

Related Report

[Journal Article] Building a Japanese Singing Database Including Rare Moras and Its Evaluation2022

Author(s)

Journal Title

DOI

Year and Date

Related Report

[Journal Article] The interaction of emotional information from the voice and touch2022

Author(s)

Journal Title

DOI

ISSN

Year and Date

Related Report

[Journal Article] INmfCA Algorithm for Training of Nonparallel Voice Conversion Systems Based on Non-Negative Matrix Factorization2022

Author(s)

Journal Title

DOI

ISSN

Year and Date

Related Report

[Journal Article] Voice Conversion Based on Deep Neural Networks for Time-Variant Linear Transformations2022

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Text-to-speech synthesis using spectral modeling based on non-negative autoencoder2022

Author(s)

Journal Title

DOI

Related Report

[Journal Article] UTMOS: UTokyo-SaruLab System for VoiceMOS Challenge 20222022

Author(s)

Journal Title

DOI

Related Report

[Journal Article] J-MAC: Japanese multi-speaker audiobook corpus for speech synthesis2022

Author(s)

Journal Title

DOI

Related Report

[Journal Article] SelfRemaster: Self-Supervised Speech Restoration with Analysis-by-Synthesis Approach Using Channel Modeling2022

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Exploring the Effectiveness of Self-supervised Learning and Classifier Chains in Emotion Recognition of Nonverbal Vocalizations2022

Author(s)

Journal Title

Related Report

[Journal Article] An objective test tool for pitch extractors' response attributes2022

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Cross-cultural similarity and cultural specificity in the emotion perception from touch. Emotion.2022

森勢将雅明治大学, 総合数理学部, 専任准教授 (60510013)