2020 Fiscal Year Annual Research Report

構音障がい者の複数モダリティを用いたコミュニケーション支援技術の研究

Research Project

Project/Area Number	17H01995
Research Institution	Kobe University
Principal Investigator	滝口哲也神戸大学, 都市安全研究センター, 教授 (40397815)
Co-Investigator(Kenkyū-buntansha)	高田哲神戸大学, 保健学研究科, 名誉教授 (10216658) 陳金輝県立広島大学, 地域創生学部, 准教授 (50777810) 中井靖宮崎大学, 教育学部, 教授 (80462050)
Project Period (FY)	2017-04-01 – 2021-03-31
Keywords	ヒューマン・インターフェース
Outline of Annual Research Achievements	今年度は昨年度までの成果をもとに，障がい者コミュニケーション支援システムに資する手法の提案，及び実証実験において性能のさらなる改善を確認した．概要は以下のとおりである． (1)モデル適応による音声認識：構音障がい者の発話データを十分に収録することは困難であるため，少量の発話データから音響モデルを学習しなければならないという問題がある．少量データから音響モデルを学習する際のアプローチとして，既存の学習済みモデルに対して目的ドメインの少量データを用いてFine tuningをする，モデル適応手法が考えられる．今年度は，健常者の不特定話者音響モデルから構音障がい者の特定話者音響モデルに音響モデル適応を行うことで，障がい者音声認識性能が向上することを示した． (2) 音声合成：今年度は本人の話者性を保ちながら明瞭性の高い音声を合成可能な音声合成システムの構築を目的とし，Transformer型音響モデルによる健常者音声合成と，健常者から構音障がい者への声質変換による音声生成を合わせた音声合成手法を提案し，有効性を示した． (3) Lip readingによる発話認識：従来のマルチモーダル音声認識において，音響特徴量を用いて画像特徴量にAttentionをかけるCross-modal attention機構により音声と画像の特徴量を統合する手法が提案されている．この従来手法では，雑音の大きい音声では重みの推定が困難な場合があるため，今年度ではある時刻の音声に関係する画像フレームは，全体の一部であるという考えに基づいて，重みの計算を一部の画像フレームに限定するローカルアテンションを提案した．提案手法によりAttention重み計算を行うフレームを限定することで，雑音環境下において適切な重みの推定が可能であることが示された．
Research Progress Status	令和2年度が最終年度であるため、記入しない。
Strategy for Future Research Activity	令和2年度が最終年度であるため、記入しない。

Research Products
(8 results)

All 2021 2020

All Presentation (8 results) (of which Int'l Joint Research: 2 results)

[Presentation] ルールベースと生成ベースを融合した雑談対話の発話生成手法2021
- Author(s)
  薛強, 滝口哲也, 有木康雄
- Organizer
  言語処理学会第27回年次大会発表論文集
[Presentation] Dysarthric Speech Conversion by Learning Disentangled Representations with Non-parallel Data2021
- Author(s)
  陳訓泉，陳金輝，高島遼一，滝口哲也
- Organizer
  日本音響学会2021年春季研究発表会講演論文集
[Presentation] マルチモーダル音声認識におけるLocal attentionを用いた音声画像統合方式2021
- Author(s)
  角田遼太，相原龍，高島遼一，滝口哲也，本山信明
- Organizer
  日本音響学会2021年春季研究発表会講演論文集
[Presentation] Dysarthric Speech Recognition Based on Deep Metric Learning2020
- Author(s)
  Yuki Takashima, Ryoichi Takashima, Tetsuya Takiguchi, Yasuo Ariki
- Organizer
  Interspeech
- Int'l Joint Research
[Presentation] An Investigation of End-to-End Speech Recognition Using Model Adaptation for Dysarthric Speakers2020
- Author(s)
  Yuya Sawa, Ryoichi Takashima, Tetsuya Takiguchi
- Organizer
  IEEE Global Conference on Consumer Electronics
- Int'l Joint Research
[Presentation] 雑談対話モデルの関連性向上のための関連語を優先した応答文生成手法の検討2020
- Author(s)
  麻生大聖, 滝口哲也, 有木康雄
- Organizer
  人工知能学会言語・音声理解と対話処理研究会
[Presentation] ゲート制御付きSource-Target Attention を用いた複数知識文に基づく応答文の生成2020
- Author(s)
  佐良和孝, 滝口哲也, 有木康雄
- Organizer
  人工知能学会言語・音声理解と対話処理研究会
[Presentation] 構音障害者音声認識における発話辞書適応の検討2020
- Author(s)
  澤佑哉, 高島遼一, 滝口哲也, 有木康雄
- Organizer
  日本音響学会2020年秋季研究発表会講演論文集

2020 Fiscal Year Annual Research Report

構音障がい者の複数モダリティを用いたコミュニケーション支援技術の研究

Principal Investigator

滝口 哲也 神戸大学, 都市安全研究センター, 教授 (40397815)

Research Products

[Presentation] ルールベースと生成ベースを融合した雑談対話の発話生成手法2021

Author(s)

Organizer

[Presentation] Dysarthric Speech Conversion by Learning Disentangled Representations with Non-parallel Data2021

Author(s)

Organizer

[Presentation] マルチモーダル音声認識におけるLocal attentionを用いた音声画像統合方式2021

Author(s)

Organizer

[Presentation] Dysarthric Speech Recognition Based on Deep Metric Learning2020

Author(s)

Organizer

[Presentation] An Investigation of End-to-End Speech Recognition Using Model Adaptation for Dysarthric Speakers2020

Author(s)

Organizer

[Presentation] 雑談対話モデルの関連性向上のための関連語を優先した応答文生成手法の検討2020

Author(s)

Organizer

[Presentation] ゲート制御付きSource-Target Attention を用いた複数知識文に基づく応答文の生成2020

Author(s)

Organizer

[Presentation] 構音障害者音声認識における発話辞書適応の検討2020

Author(s)

Organizer

滝口哲也神戸大学, 都市安全研究センター, 教授 (40397815)