複数センサの融合による発声動作からの発話内容の推定と発声補助デバイスへの応用

研究課題

研究課題/領域番号	21K11941
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分61010:知覚情報処理関連
研究機関	日本工業大学
研究代表者	大田健紘日本工業大学, 基幹工学部, 助教 (50511911)
研究期間 (年度)	2021-04-01 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	4,030千円 (直接経費: 3,100千円、間接経費: 930千円) 2023年度: 650千円 (直接経費: 500千円、間接経費: 150千円) 2022年度: 650千円 (直接経費: 500千円、間接経費: 150千円) 2021年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
キーワード	無発声音声認識 / 深層学習 / 三次元計測 / 音素 / 音声認識 / 機械学習 / 生体情報 / センサ技術
研究開始時の研究の概要	本研究は、音声を用いることなく発話内容を認識するための技術を確立し、それを実用化することを目標としている。そのためには口の形や動きなどを定量化するためのセンサ技術を明らかにし、より実用的な認識技術とするために、ヒトの自然な発話動作や発話中の身体の動作に対しても頑健な特徴量を明らかにする。本研究の成果は，喉頭がんなどの原因により後天的に発声が困難になった人々に対して発声を補助するデバイスの開発や、雑音・残響がひどい環境での音声認識、会話におけるプライバシー保護、さらには防犯など幅広い分野への応用が期待できる。
研究成果の概要	研究期間全体を通して本研究では、声帯を除去するなど発声が困難となった人の発話の補助や、既存の音声認識を補助するシステムの検討を目的とした。その結果、音声情報を用いることなく音素単位で文章を認識する深層学習を用いた技術について検討ができた。そして、発声補助方法として、カメラ及び指の皮膚電気抵抗を計測するセンサを用いた感情の推定技術やテキストからの音声合成技術について取り組み精度向上への基礎検討ができた。
研究成果の学術的意義や社会的意義	本研究は、音声情報を利用しない音声認識について、深層学習を用いた音素単位での文章認識を実現するためのデータ取得手法や深層ニューラルネットワークについて検討したことに学術的な意義がある。また、話者の感情推定や音声合成技術それぞれについて取り組み、発声が困難な方のための発声補助デバイスの開発に向けた基礎的な検討ができたことや課題の抽出ができたことに社会的な意義がある。

報告書

(4件)

研究成果
(5件)

すべて 2024 2023 2022

すべて学会発表 (5件) (うち国際学会 1件)

[学会発表] 口唇特徴点の時系列データに基づいた日本語機械読唇手法の検討2024
- 著者名/発表者名
  大田健紘、久保　茜、倉島　廉
- 学会等名
  電子情報通信学会
- 関連する報告書
  2023 実績報告書
[学会発表] Silent speech recognition using data augmentation based on a 3D lip model2023
- 著者名/発表者名
  Kenko Ota
- 学会等名
  Acoustical society of America
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] 機械読唇における三次元モデルを用いたデータ拡張が認識精度に与える影響2023
- 著者名/発表者名
  木村一馬, 大田健紘
- 学会等名
  電子情報通信学会ヘルスケア・医療情報通信技術研究会
- 関連する報告書
  2022 実施状況報告書
[学会発表] 深層学習に顔の3次元モデルを用いた無発声単語認識に関する研究2022
- 著者名/発表者名
  和田竜二, 大田健紘
- 学会等名
  電子情報通信学会ヘルスケア・医療情報通信技術研究会
- 関連する報告書
  2021 実施状況報告書
[学会発表] 複数のセンサを用いる無発声単語認識に関する研究2022
- 著者名/発表者名
  草本雅也, 大田健紘
- 学会等名
  電子情報通信学会ヘルスケア・医療情報通信技術研究会
- 関連する報告書
  2021 実施状況報告書

複数センサの融合による発声動作からの発話内容の推定と発声補助デバイスへの応用

研究代表者

大田 健紘 日本工業大学, 基幹工学部, 助教 (50511911)

4,030千円 (直接経費: 3,100千円、間接経費: 930千円)

報告書

研究成果

[学会発表] 口唇特徴点の時系列データに基づいた日本語機械読唇手法の検討2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] Silent speech recognition using data augmentation based on a 3D lip model2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 機械読唇における三次元モデルを用いたデータ拡張が認識精度に与える影響2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 深層学習に顔の3次元モデルを用いた無発声単語認識に関する研究2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] 複数のセンサを用いる無発声単語認識に関する研究2022

著者名/発表者名

学会等名

関連する報告書

大田健紘日本工業大学, 基幹工学部, 助教 (50511911)