• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Speech and video processing and modeling of speech rate conversion conversation system adapting to speaker state

Research Project

Project/Area Number 17K00281
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Research Field Human interface and interaction
Research InstitutionTokyo Denki University

Principal Investigator

Saito Hiroto  東京電機大学, システムデザイン工学部, 准教授 (00328519)

Co-Investigator(Kenkyū-buntansha) 武川 直樹  東京電機大学, システムデザイン工学部, 教授 (20366397)
Project Period (FY) 2017-04-01 – 2020-03-31
Project Status Completed (Fiscal Year 2019)
Budget Amount *help
¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2019: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2018: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2017: ¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
Keywords話速変換 / 順番交替 / 遠隔コミュニケーション / 遅延 / 音声フィードバック / 笑い検出 / 字幕表示 / モーラ数計測 / 音声と映像の同期 / 遅延の最小化 / 音声・映像同期
Outline of Final Research Achievements

We realized a video and speech processing method in which the support recipient does not perceive time lag in conversation using speech rate conversion system. The hearer is able to have a conversation with a conversation interface that could take lip sync in which video and speech are synchronized.
In addition, as a support method for the "speaker" who does not need to support listening to the slow utterance, the speaker listen the loops back speech himself after the utterance so that the speaker can understand the listening contents of the slow utterance on the hearer side. We implemented an interface that adaptively plays loop-back voice (voice feedback) and clarified the effectiveness of voice feedback.

Academic Significance and Societal Importance of the Research Achievements

遠隔ミーティングや遠隔授業等の利用機会が増加している現在,多人数が参加する会話場において,ゆっくりとした発話で聴取したい参加者もいることが想定される.
本研究成果は,聞き取りに支障のある弱者が他者との対等なコミュニケーションをとるためのインタフェース設計をした.これにより,これまで周囲とのコミュニケーションが遠慮がちで孤独感を持っている人でも,会話の場に加わることができ,例えば高齢者の生活の質の向上や,非母語の学習者の言語の能力向上につながる.本研究成果は,人間同士のコミュニケーションの多様な場に応用が可能である.

Report

(4 results)
  • 2019 Annual Research Report   Final Research Report ( PDF )
  • 2018 Research-status Report
  • 2017 Research-status Report
  • Research Products

    (7 results)

All 2019 2018 2017

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 1 results) Presentation (5 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] 話速変換を利用する会話における映像同期手法とその効果2019

    • Author(s)
      斎藤博人,小山内一樹,徳永弘子,武川直樹
    • Journal Title

      電子情報通信学会 論文誌A

      Volume: J102A Pages: 59-67

    • Related Report
      2018 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Effects of Delay Time Visualization in Speech Rate Converted Conversation2018

    • Author(s)
      斎藤 博人、熊谷 功介、徳永 弘子、武川 直樹
    • Journal Title

      電子情報通信学会論文誌D 情報・システム

      Volume: J101-D Issue: 2 Pages: 348-358

    • DOI

      10.14923/transinfj.2017HAP0014

    • ISSN
      1880-4535, 1881-0225
    • Year and Date
      2018-02-01
    • Related Report
      2017 Research-status Report
    • Peer Reviewed
  • [Presentation] 話速変換を利用する会話における音声フィードバック生成モデルの検討2019

    • Author(s)
      大場博之,斎藤博人
    • Organizer
      電気学会 C部門大会
    • Related Report
      2019 Annual Research Report
  • [Presentation] 話速変換を用いた会話における話し手への音声フィードバック手法の検討2018

    • Author(s)
      大場博之,斎藤博人
    • Organizer
      電気学会 電子・情報・システム部門大会
    • Related Report
      2018 Research-status Report
  • [Presentation] Implementation of voice feedback model for speaker in speech rate converted conversation2018

    • Author(s)
      Ju Hui Peng, Hiroto SAITO
    • Organizer
      International Workshop on Nonlinear Circuits and Signal Processing NCSP18
    • Related Report
      2017 Research-status Report
    • Int'l Joint Research
  • [Presentation] 話速変換会話における音声への映像同期の効果2018

    • Author(s)
      小山内一樹,徳永弘子,武川直樹,斎藤博人
    • Organizer
      電子情報通信学会HCS研究会3月
    • Related Report
      2017 Research-status Report
  • [Presentation] 話速変換会話における映像音声の同期・非同期再生条件の比較検討 ~ 話者が伝える宛先指定の強さは変化するのか ~2017

    • Author(s)
      小山内一樹,徳永弘子,武川直樹,斎藤博人
    • Organizer
      電子情報通信学会HCS研究会5月
    • Related Report
      2017 Research-status Report

URL: 

Published: 2017-04-28   Modified: 2021-02-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi