2016 年度実績報告書

脳性麻痺障がい者の意図認識によるユニバーサルコミュニケーション支援機器の開発

研究課題

研究課題/領域番号	25282053
研究機関	神戸大学
研究代表者	滝口哲也神戸大学, 都市安全研究センター, 准教授 (40397815)
研究分担者	有木康雄神戸大学, 都市安全研究センター, 名誉教授 (10135519) 高田哲神戸大学, 大学院保健学研究科, 教授 (10216658) 中川誠司千葉大学, フロンティア医工学センター, 教授 (70357614) 中井靖宮崎大学, 教育学部, 准教授 (80462050) 榎並直子神戸大学, 大学院システム情報学研究科, 助教 (80628925)
研究期間 (年度)	2013-04-01 – 2017-03-31
キーワード	ヒューマン・インターフェース
研究実績の概要	脳性麻痺障がい者の発話スタイルは健常者と異なり，その発話内容を理解するのが困難な場合がある．本研究では，障がい者の自立した社会生活支援に資するコミュニケーション支援機器の開発を目指している．今年度は，下記4つのサブテーマについて研究を遂行した． (I)障がい者の音声認識：話者に依存するパラメータと依存しないパラメータを持つRestricted Boltzmann Machineを用いた音響特徴量抽出法を提案し，構音障がい者の単語発話認識実験により，提案手法の評価を行った．評価実験において，既知話者に対して提案手法の有効性を示した．(II)感情変換：「ストレス度」の少ないコミュニケーションを目指し，怒り声を通常声に変換する手法の研究を遂行した．具体的には，Deep neural networksを用いた声質変換手法を提案し，客観評価実験により有効性を示した．(III)障がい者の音声合成：障害者の話者性を維持しつつ，聴き取りやすい音声を生成する方法の研究を遂行した．具体的には，隠れマルコフモデルに基づく音声合成手法においてスペクトル，ピッチパラメータに関して健常者音声合成モデルと障がい者音声合成モデルの統合手法を提案し，主観聴取評価実験により有効性を示した．(IV)画像情報を用いた発話認識：factored 3-way RBM (Restricted Boltzmann Machine)を用いた音声特徴量と画像特徴量を統合した特徴量抽出法を提案し，音声と唇画像を用いたマルチモーダル音声認識実験により，提案手法の有効性を示した．上記4つのサブテーマにおいて，各々評価実験を行い従来手法と比較して有効性を確認できたが，今後は更に精度の向上及び学習データを減らした場合について研究を遂行していく．
現在までの達成度 (段落)	28年度が最終年度であるため、記入しない。
今後の研究の推進方策	28年度が最終年度であるため、記入しない。
次年度使用額が生じた理由	28年度が最終年度であるため、記入しない。
次年度使用額の使用計画	28年度が最終年度であるため、記入しない。

研究成果
(17件)

すべて 2017 2016

すべて雑誌論文 (2件) (うち査読あり 2件、オープンアクセス 2件) 学会発表 (15件) (うち国際学会 7件)

[雑誌論文] Phone Labeling Based on the Probabilistic Representation for Dysarthric Speech Recognition2016
- 著者名/発表者名
  Yuki Takashima, Toru Nakashika, Tetsuya Takiguchi, Yasuo Ariki
- 雑誌名
  
  American Journal of Signal Processing
  
  巻: 6 ページ: 19-23
- DOI
  10.5923/j.ajsp.20160601.03
- 査読あり / オープンアクセス
[雑誌論文] Multithreading Cascade of SURF for Facial Expression Recognition2016
- 著者名/発表者名
  Jinhui Chen, Zhaojie Luo, Tetsuya Takiguchi, Yasuo Ariki
- 雑誌名
  
  EURASIP Journal on Image and Video Processing
  
  巻: 2016(1) ページ: 1-13
- DOI
  10.1186/s13640-016-0140-7
- 査読あり / オープンアクセス
[学会発表] 適応型Gaussian-Gaussian RBMを用いた構音障害者音声認識2017
- 著者名/発表者名
  高島悠樹, 中鹿亘, 滝口哲也, 有木康雄
- 学会等名
  日本音響学会2017年春季研究発表会講演論文集
- 発表場所
  明治大学（神奈川県・川崎市）
- 年月日
  2017-03-15 – 2017-03-17
[学会発表] 構音障害者のための話者性を維持したHMM音声合成システムの提案2017
- 著者名/発表者名
  上田怜奈, 滝口哲也, 有木康雄
- 学会等名
  日本音響学会2017年春季研究発表会講演論文集
- 発表場所
  明治大学（神奈川県・川崎市）
- 年月日
  2017-03-15 – 2017-03-17
[学会発表] 声質変換における非周期性指標の影響とその評価2017
- 著者名/発表者名
  伊藤大貴, 滝口哲也, 有木康雄
- 学会等名
  日本音響学会2017年春季研究発表会講演論文集
- 発表場所
  明治大学（神奈川県・川崎市）
- 年月日
  2017-03-15 – 2017-03-17
[学会発表] 最尤変換による唇動画像からの音声生成2017
- 著者名/発表者名
  羅里奈, 相原龍, 滝口哲也, 有木康雄
- 学会等名
  日本音響学会2017年春季研究発表会講演論文集
- 発表場所
  明治大学（神奈川県・川崎市）
- 年月日
  2017-03-15 – 2017-03-17
[学会発表] Expression Recognition with Ri-HOG Cascade2016
- 著者名/発表者名
  Jinhui Chen, Zhaojie Luo, Tetsuya Takiguchi, Yasuo Ariki
- 学会等名
  Third Workshop on Computer Vision for Affective Computing
- 発表場所
  台北（台湾）
- 年月日
  2016-11-24 – 2016-11-24
- 国際学会
[学会発表] Factored 3-Way Restricted Boltzmann Machine を用いたマルチモーダル音声認識の検討2016
- 著者名/発表者名
  高島悠樹, 中鹿亘, 滝口哲也, 有木康雄
- 学会等名
  日本音響学会2016年秋季研究発表会講演論文集
- 発表場所
  富山大学（富山県・富山市）
- 年月日
  2016-09-14 – 2016-09-16
[学会発表] 話速補正に基づく話者性を維持した構音障害者のための音声合成システム2016
- 著者名/発表者名
  上田怜奈, 滝口哲也, 有木康雄
- 学会等名
  日本音響学会2016年秋季研究発表会講演論文集
- 発表場所
  富山大学（富山県・富山市）
- 年月日
  2016-09-14 – 2016-09-16
[学会発表] 非負値行列因子を用いたマルチモーダル声質変換における画像特徴量の検討2016
- 著者名/発表者名
  羅里奈, 相原龍, 滝口哲也, 有木康雄
- 学会等名
  日本音響学会2016年秋季研究発表会講演論文集
- 発表場所
  富山大学（富山県・富山市）
- 年月日
  2016-09-14 – 2016-09-16
[学会発表] 複素NMFを用いた声質変換の検討2016
- 著者名/発表者名
  李権俊, 相原龍, 滝口哲也, 有木康雄
- 学会等名
  日本音響学会2016年秋季研究発表会講演論文集
- 発表場所
  富山大学（富山県・富山市）
- 年月日
  2016-09-14 – 2016-09-16
[学会発表] Emotional Voice Conversion Using Neural Networks with Different Temporal Scales of F0 based on Wavelet Transform2016
- 著者名/発表者名
  Zhaojie Luo, Tetsuya Takiguchi, Yasuo Ariki, Toru Nakashika
- 学会等名
  9th ISCA Speech Synthesis Workshop
- 発表場所
  サニーベール（米国）
- 年月日
  2016-09-13 – 2016-09-15
- 国際学会
[学会発表] Dysarthric Speech Modification Using Parallel Utterance Based on Non-negative Temporal Decomposition2016
- 著者名/発表者名
  Ryo Aihara, Tetsuya Takiguchi, and Yasuo Ariki
- 学会等名
  7th Workshop on Speech and Language Processing for Assistive Technologies
- 発表場所
  サンフランシスコ（米国）
- 年月日
  2016-09-13 – 2016-09-13
- 国際学会
[学会発表] Audio-Visual Speech Recognition Using Bimodal-Trained Bottleneck Features for a Person with Severe Hearing Loss2016
- 著者名/発表者名
  Yuki Takashima, Ryo Aihara, Tetsuya Takiguchi, Yasuo Ariki, Nobuyuki Mitani, Kiyohiro Omori, Kaoru Nakazono
- 学会等名
  Interspeech
- 発表場所
  サンフランシスコ（米国）
- 年月日
  2016-09-08 – 2016-09-12
- 国際学会
[学会発表] Lip Reading Using a Dynamic Feature of Lip Images and Convolutional Neural Networks2016
- 著者名/発表者名
  Yiting Li, Yuki Takashima, Tetsuya Takiguchi, Yasuo Ariki
- 学会等名
  IEEE/ACIS International Conference on Computer and Information Science
- 発表場所
  岡山コンベンションセンター（岡山県・岡山市）
- 年月日
  2016-06-26 – 2016-06-29
- 国際学会
[学会発表] Emotional Voice Conversion Using Deep Neural Networks with MCC and F0 Features2016
- 著者名/発表者名
  Zhaojie Luo, Tetsuya Takiguchi, Yasuo Ariki
- 学会等名
  IEEE/ACIS International Conference on Computer and Information Science
- 発表場所
  岡山コンベンションセンター（岡山県・岡山市）
- 年月日
  2016-06-26 – 2016-06-29
- 国際学会
[学会発表] Selection of an Optimum Random Matrix Using a Genetic Algorithm for Acoustic Feature Extraction2016
- 著者名/発表者名
  Yuichiro Kataoka, Toru Nakashika, Ryo Aihara, Tetsuya Takiguchi, Yasuo Ariki
- 学会等名
  IEEE/ACIS International Conference on Computer and Information Science
- 発表場所
  岡山コンベンションセンター（岡山県・岡山市）
- 年月日
  2016-06-26 – 2016-06-29
- 国際学会

2016 年度 実績報告書

脳性麻痺障がい者の意図認識によるユニバーサルコミュニケーション支援機器の開発

研究代表者

滝口 哲也 神戸大学, 都市安全研究センター, 准教授 (40397815)

研究成果

[雑誌論文] Phone Labeling Based on the Probabilistic Representation for Dysarthric Speech Recognition2016

著者名/発表者名

雑誌名

DOI

[雑誌論文] Multithreading Cascade of SURF for Facial Expression Recognition2016

著者名/発表者名

雑誌名

DOI

[学会発表] 適応型Gaussian-Gaussian RBMを用いた構音障害者音声認識2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 構音障害者のための話者性を維持したHMM音声合成システムの提案2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 声質変換における非周期性指標の影響とその評価2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 最尤変換による唇動画像からの音声生成2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Expression Recognition with Ri-HOG Cascade2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Factored 3-Way Restricted Boltzmann Machine を用いたマルチモーダル音声認識の検討2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 話速補正に基づく話者性を維持した構音障害者のための音声合成システム2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 非負値行列因子を用いたマルチモーダル声質変換における画像特徴量の検討2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 複素NMFを用いた声質変換の検討2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Emotional Voice Conversion Using Neural Networks with Different Temporal Scales of F0 based on Wavelet Transform2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Dysarthric Speech Modification Using Parallel Utterance Based on Non-negative Temporal Decomposition2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Audio-Visual Speech Recognition Using Bimodal-Trained Bottleneck Features for a Person with Severe Hearing Loss2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Lip Reading Using a Dynamic Feature of Lip Images and Convolutional Neural Networks2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Emotional Voice Conversion Using Deep Neural Networks with MCC and F0 Features2016

著者名/発表者名

2016 年度実績報告書

滝口哲也神戸大学, 都市安全研究センター, 准教授 (40397815)