• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Annual Research Report

複数センサの融合による発声動作からの発話内容の推定と発声補助デバイスへの応用

Research Project

Project/Area Number 21K11941
Research InstitutionNippon Institute of Technology

Principal Investigator

大田 健紘  日本工業大学, 基幹工学部, 助教 (50511911)

Project Period (FY) 2021-04-01 – 2024-03-31
Keywords深層学習 / 無発声音声認識 / 三次元計測
Outline of Annual Research Achievements

最終年度は、前年度までの成果をもとに、主に音声情報を用いない音声認識(無発声音声認識)であっても音声を用いた音声認識と同様に日本語文の認識を実現する手法を検討した。また、発声補助デバイス開発の基礎検討として、話者の感情推定及びテキストからの音声合成についても取り組んだ。
無発声音声認識については音素を単位として文章を認識するために、前年度の成果をもとに認識に有効な深層ニューラルネットワーク(DNN)について検討した。DNNの汎化性能を向上させることで、学習に用いた文章ではあるが未知の話者であっても0.3程度の音素誤り率が得られることがあった。話者の感情推定についてはカメラにより撮影した映像から心拍変動を計測する映像脈波計測技術及び皮膚電気反応を組み合わせた手法について検討した。音声合成については、tacotron2とwaveglow及び転移学習を用いた音声合成システムを用いて合成された音声の音質、話者性、明瞭性について検討した。ただし、感情推定及び音声合成については十分なデータでの検証ができていないため、引き続き、データ収集及び性能の検証が必要である。
本研究では、研究期間全体を通して声帯を除去するなど発声が困難となった人の発話の補助や、既存の音声認識を補助するシステムの検討を目的とした。結果として、音声を用いることなく音素単位での文章認識を実現するための技術について検討ができた。また、発声補助デバイスとして実現することを考えた場合、スマートフォンなどの小型デバイスに搭載されているカメラに加えて、指の皮膚電気抵抗を計測するセンサを搭載することで、利用者の負担となることなく、発話内容及び感情を同時推定するための基礎検証ができた。

  • Research Products

    (2 results)

All 2024 2023

All Presentation (2 results) (of which Int'l Joint Research: 1 results)

  • [Presentation] 口唇特徴点の時系列データに基づいた日本語機械読唇手法の検討2024

    • Author(s)
      大田健紘、久保 茜、倉島 廉
    • Organizer
      電子情報通信学会
  • [Presentation] Silent speech recognition using data augmentation based on a 3D lip model2023

    • Author(s)
      Kenko Ota
    • Organizer
      Acoustical society of America
    • Int'l Joint Research

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi