話者性・言語性の数理モデルと確率的統合に基づく音声情報処理の研究

研究課題

研究課題/領域番号	25730105
研究種目	若手研究(B)
配分区分	基金
研究分野	知覚情報処理
研究機関	東京大学
研究代表者	齋藤大輔東京大学, 情報理工学(系)研究科, 助教 (40615150)
研究期間 (年度)	2013-04-01 – 2016-03-31
研究課題ステータス	完了 (2015年度)
配分額 *注記	4,160千円 (直接経費: 3,200千円、間接経費: 960千円) 2015年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円) 2014年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円) 2013年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
キーワード	音声情報処理 / 声質変換 / 話者識別 / 行列変量 / 言語識別 / テンソル解析 / 話者認識 / 言語認識 / 相対関係特徴
研究成果の概要	本研究課題では、音声情報処理技術のさらなる発展を目指し、言語性と話者性を分離して捉える数理的モデルの確立および言語性・話者性の数理モデルを統合するフレームワークによる音声情報処理技術の実現を目的とし、その技術確立に取り組んだ。テンソル解析に基づく音声表現とそれに基づく言語識別・話者識別への応用技術を確立した。また行列変量確率分布に基づく新しい声質変換の枠組とその技術確立に取り組んだ。

報告書

(4件)

研究成果
(20件)

すべて 2016 2015 2014 2013

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (19件) (うち国際学会 1件)

[雑誌論文] Eigenvoice-Based Character Conversion for Arbitrary Speakers Using Various Character Voices of a Skilled Voice Actor2013
- 著者名/発表者名
  T. Pongkittiphan, D. Saito, N. Minematsu, K. Hirose
- 雑誌名
  
  信号処理
  
  巻: 17 号: 4 ページ: 139-142
- DOI
  10.2299/jsp.17.139
- NAID
  130004849293
- ISSN
  1342-6230, 1880-1013
- 関連する報告書
  2013 実施状況報告書
- 査読あり
[学会発表] 声・顔の固有空間と GMM に基づく両空間の印象的対応付けに関する検討2016
- 著者名/発表者名
  大杉康仁, 齋藤大輔, 峯松信明
- 学会等名
  音学シンポジウム2016
- 発表場所
  東海大学（東京都港区）
- 年月日
  2016-05-21
- 関連する報告書
  2015 実績報告書
[学会発表] テンソル分解に基づく音声表現とその言語識別・話者識別への応用2016
- 著者名/発表者名
  鈴木颯, 齋藤大輔, 峯松信明
- 学会等名
  電子情報通信学会音声研究会
- 発表場所
  別府国際コンベンションセンター（大分県別府市）
- 年月日
  2016-03-28
- 関連する報告書
  2015 実績報告書
[学会発表] 話者空間の基底成分を用いたディープニューラルネットワーク任意話者声質変換2016
- 著者名/発表者名
  橋本哲弥, 柏木陽佑, 齋藤大輔, 峯松信明
- 学会等名
  日本音響学会春季研究発表会
- 発表場所
  横浜桐蔭大学（神奈川県横浜市）
- 年月日
  2016-03-09
- 関連する報告書
  2015 実績報告書
[学会発表] Integration of Multi-Speaker Training and Speaker Adaptation for DBLSTM-RNN-based Text-To-Speech Synthesis2016
- 著者名/発表者名
  Yi Zhao, Nobuaki Minematsu, Daisuke Saito
- 学会等名
  日本音響学会春季研究発表会
- 発表場所
  横浜桐蔭大学（神奈川県横浜市）
- 年月日
  2016-03-09
- 関連する報告書
  2015 実績報告書
[学会発表] 行列変量ガウス混合モデルに基づく複数フレーム特徴を考慮した声質変換2016
- 著者名/発表者名
  楊奕, 内田秀継, 齋藤大輔, 峯松信明
- 学会等名
  日本音響学会春季研究発表会
- 発表場所
  横浜桐蔭大学（神奈川県横浜市）
- 年月日
  2016-03-09
- 関連する報告書
  2015 実績報告書
[学会発表] Deep Neural Networkを用いた話者空間基底への射影による声質変換2015
- 著者名/発表者名
  橋本哲弥, 柏木陽佑, 齋藤大輔, 峯松信明
- 学会等名
  電子情報通信学会音声研究会
- 発表場所
  名古屋工業大学（愛知県名古屋市）
- 年月日
  2015-12-02
- 関連する報告書
  2015 実績報告書
[学会発表] MULTI-SPEAKER SPEECH SYNTHESIS AND SPEAKER ADAPTATION BASED ON DEEP BIDIRECTIONAL LONG SHORT-TERM MEMORY RECURRENT NEURAL NETWORK2015
- 著者名/発表者名
  Yi Zhao, Nobuaki Minematsu, Daisuke Saito
- 学会等名
  電子情報通信学会音声研究会
- 発表場所
  名古屋工業大学（愛知県名古屋市）
- 年月日
  2015-12-02
- 関連する報告書
  2015 実績報告書
[学会発表] テンソル分解に基づく言語情報表現を用いた言語識別に関する検討2015
- 著者名/発表者名
  鈴木颯, 齋藤大輔, 峯松信明
- 学会等名
  日本音響学会秋季研究発表会
- 発表場所
  会津大学（福島県会津若松市）
- 年月日
  2015-09-16
- 関連する報告書
  2015 実績報告書
[学会発表] 混合ガウス分布を用いた自然音声への人工感の付与2015
- 著者名/発表者名
  小林航也, 齋藤大輔, 峯松信明, 広瀬啓吉
- 学会等名
  音学シンポジウム2015
- 発表場所
  電気通信大学（東京都調布市）
- 年月日
  2015-05-23
- 関連する報告書
  2015 実績報告書
[学会発表] SAS: A speaker verification spoofing database containing diverse attacks2015
- 著者名/発表者名
  Zhizheng Wu, Ali Khodabakhsh, Cenk Demiroglu, Junichi Yamagishi, Daisuke Saito, Tomoki Toda, Simon King
- 学会等名
  ICASSP
- 発表場所
  Brisbane (Australia)
- 年月日
  2015-04-19
- 関連する報告書
  2015 実績報告書
- 国際学会
[学会発表] テンソル分解に基づく話者情報表現を用いた話者識別の検討2015
- 著者名/発表者名
  チン・トゥアン・トゥー, 齋藤大輔, 峯松信明, 広瀬啓吉
- 学会等名
  日本音響学会春季研究発表会
- 発表場所
  中央大学, 東京
- 年月日
  2015-03-16 – 2015-03-18
- 関連する報告書
  2014 実施状況報告書
[学会発表] Voice Conversion Based on Matrix Variate Gaussian Mixture Model2014
- 著者名/発表者名
  Daisuke Saito, Hidenobu Doi, Nobuaki Minematsu, Keikichi Hirose
- 学会等名
  IEEE ICSP2014
- 発表場所
  杭州, 中国
- 年月日
  2014-10-19 – 2014-10-23
- 関連する報告書
  2014 実施状況報告書
[学会発表] Application of Matrix Variate Gaussian Mixture Model to Statistical Voice Conversion2014
- 著者名/発表者名
  Daisuke Saito, Hidenobu Doi, Nobuaki Minematsu, Keikichi Hirose
- 学会等名
  ISCA INTERSPEECH 2014
- 発表場所
  Singapore, Singapore
- 年月日
  2014-09-14 – 2014-09-18
- 関連する報告書
  2014 実施状況報告書
[学会発表] Tensor representation for speaker characteristics in speech2014
- 著者名/発表者名
  Daisuke Saito, Nobuaki Minematsu, Keikichi Hirose
- 学会等名
  Forum Acusticum
- 発表場所
  Krakow, Poland
- 年月日
  2014-09-07 – 2014-09-12
- 関連する報告書
  2014 実施状況報告書
[学会発表] 話者依存サブネットワークを用いた深層学習による多対一声質変換2014
- 著者名/発表者名
  橋本哲弥, 柏木陽佑, 齋藤大輔, 広瀬啓吉, 峯松信明
- 学会等名
  日本音響学会秋季研究発表会
- 発表場所
  北海学園大学, 北海道
- 年月日
  2014-09-03 – 2014-09-05
- 関連する報告書
  2014 実施状況報告書
[学会発表] 行列変量正規分布の混合モデルとその声質変換への応用2014
- 著者名/発表者名
  齋藤大輔, 土井秀信, 峯松信明, 広瀬啓吉
- 学会等名
  情報処理学会音声言語情報処理研究会
- 発表場所
  ホテル花巻，岩手県
- 年月日
  2014-07-24 – 2014-07-26
- 関連する報告書
  2014 実施状況報告書
[学会発表] 行列変量ガウス混合分布に基づく声質変換の検討2014
- 著者名/発表者名
  土井秀信, 齋藤大輔, 峯松信明, 広瀬啓吉
- 学会等名
  日本音響学会春季研究発表会
- 発表場所
  日本大学, 御茶ノ水, 東京
- 関連する報告書
  2013 実施状況報告書
[学会発表] 構造的表象とGMMスーパーベクトルを用いた言語識別に関する検討2014
- 著者名/発表者名
  鈴木颯, 齋藤大輔, 峯松信明, 広瀬啓吉
- 学会等名
  日本音響学会春季研究発表会
- 発表場所
  日本大学, 御茶ノ水, 東京
- 関連する報告書
  2013 実施状況報告書
[学会発表] Noisy Channel Modelに基づく音声特徴量強調に関する検討2014
- 著者名/発表者名
  バン・フクアンフイ, 齋藤大輔, 柏木陽佑, 峯松信明, 広瀬啓吉
- 学会等名
  日本音響学会春季研究発表会
- 発表場所
  日本大学, 御茶ノ水, 東京
- 関連する報告書
  2013 実施状況報告書

話者性・言語性の数理モデルと確率的統合に基づく音声情報処理の研究

研究代表者

齋藤 大輔 東京大学, 情報理工学(系)研究科, 助教 (40615150)

4,160千円 (直接経費: 3,200千円、間接経費: 960千円)

報告書

研究成果

[雑誌論文] Eigenvoice-Based Character Conversion for Arbitrary Speakers Using Various Character Voices of a Skilled Voice Actor2013

著者名/発表者名

雑誌名

DOI

NAID

ISSN

関連する報告書

[学会発表] 声・顔の固有空間と GMM に基づく両空間の印象的対応付けに関する検討2016

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] テンソル分解に基づく音声表現とその言語識別・話者識別への応用2016

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 話者空間の基底成分を用いたディープニューラルネットワーク任意話者声質変換2016

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Integration of Multi-Speaker Training and Speaker Adaptation for DBLSTM-RNN-based Text-To-Speech Synthesis2016

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 行列変量ガウス混合モデルに基づく複数フレーム特徴を考慮した声質変換2016

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Deep Neural Networkを用いた 話者空間基底への射影による声質変換2015

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] MULTI-SPEAKER SPEECH SYNTHESIS AND SPEAKER ADAPTATION BASED ON DEEP BIDIRECTIONAL LONG SHORT-TERM MEMORY RECURRENT NEURAL NETWORK2015

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] テンソル分解に基づく言語情報表現を用いた言語識別に関する検討2015

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 混合ガウス分布を用いた自然音声への人工感の付与2015

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] SAS: A speaker verification spoofing database containing diverse attacks2015

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] テンソル分解に基づく話者情報表現を用いた話者識別の検討2015

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Voice Conversion Based on Matrix Variate Gaussian Mixture Model2014

齋藤大輔東京大学, 情報理工学(系)研究科, 助教 (40615150)

[学会発表] Deep Neural Networkを用いた話者空間基底への射影による声質変換2015

[学会発表] 行列変量正規分布の混合モデルとその声質変換への応用2014