• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Annual Research Report

日常会話の韻律モデル構築に向けた話者混在音声の分析基盤

Research Project

Project/Area Number 19H01252
Research InstitutionUtsunomiya University

Principal Investigator

森 大毅  宇都宮大学, 工学部, 准教授 (10302184)

Co-Investigator(Kenkyū-buntansha) 前川 喜久雄  大学共同利用機関法人人間文化研究機構国立国語研究所, 音声言語研究領域, 教授 (20173693)
小磯 花絵  大学共同利用機関法人人間文化研究機構国立国語研究所, 音声言語研究領域, 教授 (30312200)
小野 順貴  東京都立大学, システムデザイン研究科, 教授 (80334259)
永田 智洋  帝京大学, 理工学部, 助教 (80823450)
Project Period (FY) 2019-04-01 – 2022-03-31
KeywordsニューラルF0モデル / 音源分離 / 話者埋め込み
Outline of Annual Research Achievements

(1) 模擬重畳音声を利用したF0パターン分離モデルの有効性検証
前年度に考案した話者混在音声から目的話者のF0を推定するニューラルネットを「日本語話し言葉コーパス」男女20名の話者の音声を用いた模擬重畳音声に適用し、分離前に比ベ有声/無声誤りを72%、F0のグロスエラーを88%低減でき、F0の分離を高精度に行うことが可能であることを示した。
(2) 未知話者に対応したF0パターン分離インタフェースの開発
「日本語話し言葉コーパス」で学習したモデルを別のデータに適用するにあたっては、ターゲット話者を指定するための埋め込みベクトルをいかに推定するかが課題となる。そこで、F0パターンの推定結果を視察しながらリアルタイムに話者性を調整するインタフェースを開発した。
(3) F0パターン分離モデルの日常会話への適用
「日本語話し言葉コーパス」の模擬重畳音声を用いて学習したモデルを用いて、「日本語日常会話コーパス」の中央ICレコーダ音声から各話者のF0を分離する検討を行った。未知の話者に対する話者埋め込みの推定については、(2)の手動調整、および埋め込みの再学習による方法を検討したが、いずれの方法によっても、模擬重畳音声の場合とは異なり十分な性能が得られなかった。以下に考えられる原因を挙げる。(i)模擬重畳音声と異なり実環境では混合比がまちまちで、特にレベルが小さい話者についてはモデルとのミスマッチが大きい。(ii)実音声は収録環境がまちまちで、モデルとのミスマッチの原因になっている。

Research Progress Status

令和3年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

令和3年度が最終年度であるため、記入しない。

  • Research Products

    (15 results)

All 2022 2021

All Journal Article (3 results) (of which Peer Reviewed: 2 results,  Open Access: 3 results) Presentation (12 results) (of which Invited: 1 results)

  • [Journal Article] Comparison of machine learning algorithms and acoustic features in emotion recognition from spontaneous speech2022

    • Author(s)
      Takahisa Iizuka, Hiroki Mori
    • Journal Title

      Acoustical Science and Technology

      Volume: - Pages: -

    • Peer Reviewed / Open Access
  • [Journal Article] 『日本語日常会話コーパス』本公開版の構築2022

    • Author(s)
      小磯 花絵
    • Journal Title

      自然言語処理

      Volume: 29 Pages: 224-229

    • DOI

      10.5715/jnlp.29.224

    • Open Access
  • [Journal Article] Pitch contour separation from overlapping speech2021

    • Author(s)
      Hiroki Mori
    • Journal Title

      Proc. Interspeech 2021

      Volume: - Pages: 1209-1213

    • DOI

      10.21437/Interspeech.2021-2164

    • Peer Reviewed / Open Access
  • [Presentation] 『日本語日常会話コーパス』を対象とした話者混在音声の韻律の分析2022

    • Author(s)
      森 大毅
    • Organizer
      シンポジウム 日常会話コーパスVII
  • [Presentation] 複数の自然対話音声コーパスの併用によるend-to-end対話音声合成の高品質化2022

    • Author(s)
      西野 広直, 森 大毅
    • Organizer
      日本音響学会2022年春季研究発表会
  • [Presentation] コーパスを通して日常のことばの特徴を探る2022

    • Author(s)
      小磯 花絵
    • Organizer
      第16回NINJALフォーラム「ここまで進んだ!ここまで分かった!多様な言語資源に基づく日本語研究」
  • [Presentation] 話し言葉の分析:『日本語日常会話コーパス』CEJC2022

    • Author(s)
      小磯 花絵
    • Organizer
      講演会「日本語コーパスの設計・構築・応用」
  • [Presentation] 『日本語日常会話コーパス』を活用した話し言葉研究の可能性2022

    • Author(s)
      小磯 花絵
    • Organizer
      シンポジウム 日常会話コーパスVII
  • [Presentation] 『日本語日常会話コーパス』バランスの検証と研究の可能性2022

    • Author(s)
      小磯 花絵
    • Organizer
      シンポジウム「ことば・認知・インタラクション10」
  • [Presentation] 『日本語日常会話コーパス』の設計と特徴2022

    • Author(s)
      小磯 花絵,天谷 晴香,石本 祐一,居關 友里子,臼田 泰如,柏野 和佳子,川端 良子,田中 弥生,伝 康晴,西川 賢哉,渡邊 友香
    • Organizer
      言語処理学会第28回年次大会
  • [Presentation] 条件異音再考2022

    • Author(s)
      前川 喜久雄
    • Organizer
      日本音響学会音声研究会
    • Invited
  • [Presentation] 話者混在音声からのfo軌跡の分離2021

    • Author(s)
      森 大毅
    • Organizer
      日本音響学会2021年秋季研究発表会
  • [Presentation] 自発音声コーパスを用いて合成した音声で話すエージェントが会話相手の行動に与える影響2021

    • Author(s)
      飯塚 喬久, 森 大毅
    • Organizer
      日本音響学会2021年秋季研究発表会
  • [Presentation] 日本語日常会話コーパスの構築 -日常のことばの特徴を探る-2021

    • Author(s)
      小磯 花絵
    • Organizer
      第六回学習者コーパス・シンポジウム
  • [Presentation] 非同期会話録音に対する時間周波数マスキングと独立ベクトル分析を用いた音源分離の検討2021

    • Author(s)
      南木 春希, 山岡 洸瑛, 若林 佑幸, 小野 順貴
    • Organizer
      音学シンポジウム

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi