• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Annual Research Report

構音障がい者の複数モダリティを用いたコミュニケーション支援技術の研究

Research Project

Project/Area Number 17H01995
Research InstitutionKobe University

Principal Investigator

滝口 哲也  神戸大学, 都市安全研究センター, 教授 (40397815)

Co-Investigator(Kenkyū-buntansha) 高田 哲  神戸大学, 保健学研究科, 名誉教授 (10216658)
陳 金輝  県立広島大学, 地域創生学部, 准教授 (50777810)
中井 靖  宮崎大学, 教育学部, 教授 (80462050)
Project Period (FY) 2017-04-01 – 2021-03-31
Keywordsヒューマン・インターフェース
Outline of Annual Research Achievements

今年度は昨年度までの成果をもとに,障がい者コミュニケーション支援システムに資する手法の提案,及び実証実験において性能のさらなる改善を確認した.概要は以下のとおりである.
(1)モデル適応による音声認識:構音障がい者の発話データを十分に収録することは困難であるため,少量の発話データから音響モデルを学習しなければならないという問題がある.少量データから音響モデルを学習する際のアプローチとして,既存の学習済みモデルに対して目的ドメインの少量データを用いてFine tuningをする,モデル適応手法が考えられる.今年度は,健常者の不特定話者音響モデルから構音障がい者の特定話者音響モデルに音響モデル適応を行うことで,障がい者音声認識性能が向上することを示した.
(2) 音声合成:今年度は本人の話者性を保ちながら明瞭性の高い音声を合成可能な音声合成システムの構築を目的とし,Transformer型音響モデルによる健常者音声合成と,健常者から構音障がい者への声質変換による音声生成を合わせた音声合成手法を提案し,有効性を示した.
(3) Lip readingによる発話認識:従来のマルチモーダル音声認識において,音響特徴量を用いて画像特徴量にAttentionをかけるCross-modal attention機構により音声と画像の特徴量を統合する手法が提案されている.この従来手法では,雑音の大きい音声では重みの推定が困難な場合があるため,今年度ではある時刻の音声に関係する画像フレームは,全体の一部であるという考えに基づいて,重みの計算を一部の画像フレームに限定するローカルアテンションを提案した.提案手法によりAttention重み計算を行うフレームを限定することで,雑音環境下において適切な重みの推定が可能であることが示された.

Research Progress Status

令和2年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

令和2年度が最終年度であるため、記入しない。

  • Research Products

    (8 results)

All 2021 2020

All Presentation (8 results) (of which Int'l Joint Research: 2 results)

  • [Presentation] ルールベースと生成ベースを融合した雑談対話の発話生成手法2021

    • Author(s)
      薛強, 滝口哲也, 有木康雄
    • Organizer
      言語処理学会第27回年次大会発表論文集
  • [Presentation] Dysarthric Speech Conversion by Learning Disentangled Representations with Non-parallel Data2021

    • Author(s)
      陳 訓泉,陳 金輝,高島 遼一,滝口 哲也
    • Organizer
      日本音響学会2021年春季研究発表会講演論文集
  • [Presentation] マルチモーダル音声認識におけるLocal attentionを用いた音声画像統合方式2021

    • Author(s)
      角田 遼太,相原 龍,高島 遼一,滝口 哲也,本山 信明
    • Organizer
      日本音響学会2021年春季研究発表会講演論文集
  • [Presentation] Dysarthric Speech Recognition Based on Deep Metric Learning2020

    • Author(s)
      Yuki Takashima, Ryoichi Takashima, Tetsuya Takiguchi, Yasuo Ariki
    • Organizer
      Interspeech
    • Int'l Joint Research
  • [Presentation] An Investigation of End-to-End Speech Recognition Using Model Adaptation for Dysarthric Speakers2020

    • Author(s)
      Yuya Sawa, Ryoichi Takashima, Tetsuya Takiguchi
    • Organizer
      IEEE Global Conference on Consumer Electronics
    • Int'l Joint Research
  • [Presentation] 雑談対話モデルの関連性向上のための関連語を優先した応答文生成手法の検討2020

    • Author(s)
      麻生 大聖, 滝口 哲也, 有木 康雄
    • Organizer
      人工知能学会 言語・音声理解と対話処理研究会
  • [Presentation] ゲート制御付きSource-Target Attention を用いた複数知識文に基づく応答文の生成2020

    • Author(s)
      佐良 和孝, 滝口 哲也, 有木 康雄
    • Organizer
      人工知能学会 言語・音声理解と対話処理研究会
  • [Presentation] 構音障害者音声認識における発話辞書適応の検討2020

    • Author(s)
      澤 佑哉, 高島 遼一, 滝口 哲也, 有木 康雄
    • Organizer
      日本音響学会2020年秋季研究発表会講演論文集

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi