• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Infrastructure for analyzing the prosody of speaker-mixed speech for modeling daily conversation

Research Project

Project/Area Number 19H01252
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeSingle-year Grants
Section一般
Review Section Basic Section 02060:Linguistics-related
Research InstitutionUtsunomiya University

Principal Investigator

Mori Hiroki  宇都宮大学, 工学部, 准教授 (10302184)

Co-Investigator(Kenkyū-buntansha) 前川 喜久雄  大学共同利用機関法人人間文化研究機構国立国語研究所, 音声言語研究領域, 教授 (20173693)
小磯 花絵  大学共同利用機関法人人間文化研究機構国立国語研究所, 音声言語研究領域, 教授 (30312200)
小野 順貴  東京都立大学, システムデザイン研究科, 教授 (80334259)
永田 智洋  帝京大学, 理工学部, 助教 (80823450)
Project Period (FY) 2019-04-01 – 2022-03-31
Project Status Completed (Fiscal Year 2021)
Budget Amount *help
¥17,810,000 (Direct Cost: ¥13,700,000、Indirect Cost: ¥4,110,000)
Fiscal Year 2021: ¥3,120,000 (Direct Cost: ¥2,400,000、Indirect Cost: ¥720,000)
Fiscal Year 2020: ¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
Fiscal Year 2019: ¥11,310,000 (Direct Cost: ¥8,700,000、Indirect Cost: ¥2,610,000)
KeywordsニューラルF0モデル / 音源分離 / 話者埋め込み / 韻律 / イントネーション / 話し言葉 / 深層学習 / 再帰ニューラルネット / 時系列
Outline of Research at the Start

「日本語日常会話コーパス」の構築は,定量的・包括的な会話の韻律研究を実現する画期的な取り組みであるが,日常場面での収録のため各話者の音声が分離されていない。このため,韻律研究上重要な音声特徴であるF0(基本周波数)が正しく推定できず,このコーパスを利用した韻律研究を推進する上で障害となっている。
本研究は,日常的な生活環境で収録した話者混在音声からF0情報を話者ごとに分離することで,これまで不可能であった韻律の定量的分析を可能とする基盤技術を確立することを目的とする。本研究では,ニューラル音声合成におけるF0パターン生成の考え方をF0推定に応用するアイデアによりこの問題の解決を目指す。

Outline of Final Research Achievements

This project aimed to establish a fundamental technology to estimates pitch independently for each speaker given overlapping speech recorded in everyday circumstances, and achieved the following:
(1) Developed a speech separation that takes the movement of speakers or microphones into account. This suppresses components of speakers other than the target, and is expected to improve the accuracy of subsequent pitch estimation. A listening test for the Corpus of Everyday Japanese Conversation revealed its effectiveness.
(2) Developed a novel deep learning method for extracting pitch information of specified speaker. Results of evaluation experiments on overlapping speech demonstrated that the proposed method could reduce the gross pitch error by than 60% compared to the case for which the proposed method was not applied.

Academic Significance and Societal Importance of the Research Achievements

日常場面の中で当事者たち自身の動機や目的によって自然に生じた会話を収録したコーパスでは、各話者の音声が音響的に分離されておらず、本人以外の声も入り込んでしまう。日常会話では複数の話者の発話が頻繁に重なっており,そのような部分では音声の韻律的特徴を正確に分析することができない。本研究の成果は、このような話者混在音声から各話者の韻律情報を分離する技術に道筋を付けるものであり、実環境で収録されたデータに応用することで、音声学・社会科学・心理学・音声情報処理をはじめとする広範な研究分野に貢献することが期待される。

Report

(4 results)
  • 2021 Annual Research Report   Final Research Report ( PDF )
  • 2020 Annual Research Report
  • 2019 Annual Research Report
  • Research Products

    (28 results)

All 2022 2021 2020 2019

All Journal Article (6 results) (of which Peer Reviewed: 5 results,  Open Access: 5 results) Presentation (22 results) (of which Invited: 1 results)

  • [Journal Article] Comparison of machine learning algorithms and acoustic features in emotion recognition from spontaneous speech2022

    • Author(s)
      Takahisa Iizuka, Hiroki Mori
    • Journal Title

      Acoustical Science and Technology

      Volume: -

    • Related Report
      2021 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] The Construction of the full version of the Corpus of Everyday Japanese Conversation2022

    • Author(s)
      小磯花絵
    • Journal Title

      Journal of Natural Language Processing

      Volume: 29 Issue: 1 Pages: 224-229

    • DOI

      10.5715/jnlp.29.224

    • ISSN
      1340-7619, 2185-8314
    • Related Report
      2021 Annual Research Report
    • Open Access
  • [Journal Article] Pitch contour separation from overlapping speech2021

    • Author(s)
      Hiroki Mori
    • Journal Title

      Proc. Interspeech 2021

      Volume: - Pages: 1209-1213

    • DOI

      10.21437/interspeech.2021-2164

    • Related Report
      2021 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Gaming corpus for studying social screams2020

    • Author(s)
      Hiroki Mori, Yuki Kikuchi
    • Journal Title

      Proc. Interspeech 2020

      Volume: なし Pages: 3132-3135

    • DOI

      10.21437/interspeech.2020-2553

    • Related Report
      2020 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Effectiveness of Speech Mode Adaptation for Improving Dialogue Speech Synthesis2019

    • Author(s)
      Kazuki Kaya and Hiroki Mori
    • Journal Title

      IEICE Transactions on Information and Systems

      Volume: E102.D Issue: 10 Pages: 2064-2066

    • DOI

      10.1587/transinf.2019EDL8024

    • NAID

      130007722181

    • ISSN
      0916-8532, 1745-1361
    • Year and Date
      2019-10-01
    • Related Report
      2019 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Conversational and social laughter synthesis with WaveNet2019

    • Author(s)
      Hiroki Mori, Tomohiro Nagata, and Yoshiko Arimoto
    • Journal Title

      Proc. Interspeech 2019

      Volume: - Pages: 520-523

    • DOI

      10.21437/interspeech.2019-2131

    • Related Report
      2019 Annual Research Report
    • Peer Reviewed / Open Access
  • [Presentation] 『日本語日常会話コーパス』を対象とした話者混在音声の韻律の分析2022

    • Author(s)
      森 大毅
    • Organizer
      シンポジウム 日常会話コーパスVII
    • Related Report
      2021 Annual Research Report
  • [Presentation] 複数の自然対話音声コーパスの併用によるend-to-end対話音声合成の高品質化2022

    • Author(s)
      西野 広直, 森 大毅
    • Organizer
      日本音響学会2022年春季研究発表会
    • Related Report
      2021 Annual Research Report
  • [Presentation] コーパスを通して日常のことばの特徴を探る2022

    • Author(s)
      小磯 花絵
    • Organizer
      第16回NINJALフォーラム「ここまで進んだ!ここまで分かった!多様な言語資源に基づく日本語研究」
    • Related Report
      2021 Annual Research Report
  • [Presentation] 話し言葉の分析:『日本語日常会話コーパス』CEJC2022

    • Author(s)
      小磯 花絵
    • Organizer
      講演会「日本語コーパスの設計・構築・応用」
    • Related Report
      2021 Annual Research Report
  • [Presentation] 『日本語日常会話コーパス』を活用した話し言葉研究の可能性2022

    • Author(s)
      小磯 花絵
    • Organizer
      シンポジウム 日常会話コーパスVII
    • Related Report
      2021 Annual Research Report
  • [Presentation] 『日本語日常会話コーパス』バランスの検証と研究の可能性2022

    • Author(s)
      小磯 花絵
    • Organizer
      シンポジウム「ことば・認知・インタラクション10」
    • Related Report
      2021 Annual Research Report
  • [Presentation] 『日本語日常会話コーパス』の設計と特徴2022

    • Author(s)
      小磯 花絵,天谷 晴香,石本 祐一,居關 友里子,臼田 泰如,柏野 和佳子,川端 良子,田中 弥生,伝 康晴,西川 賢哉,渡邊 友香
    • Organizer
      言語処理学会第28回年次大会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 条件異音再考2022

    • Author(s)
      前川 喜久雄
    • Organizer
      日本音響学会音声研究会
    • Related Report
      2021 Annual Research Report
    • Invited
  • [Presentation] 話者混在音声からのfo軌跡の分離2021

    • Author(s)
      森 大毅
    • Organizer
      日本音響学会2021年秋季研究発表会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 自発音声コーパスを用いて合成した音声で話すエージェントが会話相手の行動に与える影響2021

    • Author(s)
      飯塚 喬久, 森 大毅
    • Organizer
      日本音響学会2021年秋季研究発表会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 日本語日常会話コーパスの構築 -日常のことばの特徴を探る-2021

    • Author(s)
      小磯 花絵
    • Organizer
      第六回学習者コーパス・シンポジウム
    • Related Report
      2021 Annual Research Report
  • [Presentation] 非同期会話録音に対する時間周波数マスキングと独立ベクトル分析を用いた音源分離の検討2021

    • Author(s)
      南木 春希, 山岡 洸瑛, 若林 佑幸, 小野 順貴
    • Organizer
      音学シンポジウム
    • Related Report
      2021 Annual Research Report
  • [Presentation] 韻律を考慮したend-to-end方式に基づく自発音声合成2021

    • Author(s)
      西野 広直,森 大毅
    • Organizer
      日本音響学会2021年春季研究発表会
    • Related Report
      2020 Annual Research Report
  • [Presentation] 自発音声に基づく合成音声で対話するシステムがユーザに与える影響の調査2021

    • Author(s)
      飯塚 喬久,森 大毅
    • Organizer
      日本音響学会2021年春季研究発表会
    • Related Report
      2020 Annual Research Report
  • [Presentation] データサイエンスが使えるようになるまで2020

    • Author(s)
      前川喜久雄
    • Organizer
      日本語文法学会第21回大会
    • Related Report
      2020 Annual Research Report
  • [Presentation] アクセント句頭のFo上昇量はtone間距離で決まる2020

    • Author(s)
      前川喜久雄,森大毅
    • Organizer
      日本音声学会第341回研究例会
    • Related Report
      2020 Annual Research Report
  • [Presentation] 録音音声とライブ音声による説明の違いが聞き手反応に及ぼす影響2020

    • Author(s)
      高松屋 友翼, 森 大毅
    • Organizer
      HCGシンポジウム2020
    • Related Report
      2020 Annual Research Report
  • [Presentation] 原稿の有無が説明者の発話と被説明者の反応に与える影響の分析2020

    • Author(s)
      高松屋 友翼,森 大毅
    • Organizer
      日本音響学会2020年春季研究発表会
    • Related Report
      2019 Annual Research Report
  • [Presentation] 大規模日常会話コーパスにおけるイントネーションラベリング2020

    • Author(s)
      菊池 英明, 山田 高明, 小磯 花絵
    • Organizer
      日本音響学会2020年春季研究発表会
    • Related Report
      2019 Annual Research Report
  • [Presentation] 『日本語日常会話コーパス』への韻律ラベリング -ラベリングの設計と日常会話の韻律の特徴-2020

    • Author(s)
      小磯 花絵, 菊池 英明, 山田 高明
    • Organizer
      人工知能学会第88回SLUD研究会
    • Related Report
      2019 Annual Research Report
  • [Presentation] 感情表出系感動詞の鼻音化に関する種々の分析2019

    • Author(s)
      高岸 勇斗,森 大毅
    • Organizer
      日本音響学会2019年秋季研究発表会
    • Related Report
      2019 Annual Research Report
  • [Presentation] 自発音声に対するニューラルF0モデリングの可能性2019

    • Author(s)
      永田 智洋,森 大毅
    • Organizer
      日本音響学会2019年秋季研究発表会
    • Related Report
      2019 Annual Research Report

URL: 

Published: 2019-04-18   Modified: 2023-01-30  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi