2014 年度実績報告書

聴覚の情報表現に基づく高度音声分析変換合成方式の研究

研究課題

研究課題/領域番号	24300073
研究機関	和歌山大学
研究代表者	河原英紀和歌山大学, システム工学部, 教授 (40294300)
研究分担者	西村竜一和歌山大学, システム工学部, 助教 (00379611) 入野俊夫和歌山大学, システム工学部, 教授 (20346331) 戸田智基奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90403328) 坂野秀樹名城大学, 理工学部, 准教授 (20335003) 榊原健一北海道医療大学, 心理科学部, 准教授 (80396168) 森勢将雅山梨大学, 大学院医学工学総合研究部, 助教 (60510013)
研究期間 (年度)	2012-04-01 – 2015-03-31
キーワード	音声情報処理 / 音声分析 / 音声変換 / 標本化 / テクスチャ
研究実績の概要	本研究の目的は、世界最先端のレベルにある音声分析変換合成技術STRAIGHTとその周辺技術を、障害音声、歌唱音声、感情音声、悲鳴などの異常を知らせる音声など、現在の技術レベルでは十分な処理が困難な音声の処理にまで拡張し、音声を用いた人間と人間、人間と機械とのコミュニケーションに生じる様々な困難を克服するための技術基盤を確立するとともに、それらの成果をツール群として適切な形で社会に還元することにある。最終年度にあたる本年度では、前年の最後に拡張された時変多属性任意事例数モーフィングツールの整備、基本周波数分析部分の統計モデルに基づく頑健性の大きな改善、実時間処理機能を利用したツール群の整備、タブレットデバイスへの実装により、当初計画を満足する成果を上げるとともに、計算効率を二倍以上でかつ客観的品質においても主観的品質においても、これまでのTANDEM-STRAIGHTを凌駕するCheap Trickという方法を発明するという、大きな進展があった。さらに、最初に挙げた通常の音声を大きく外れる音声に顕著に現れる周期性からの逸脱を、定量化することのできるまったく新しい表現と原理も発見された。この後者の原理は、最初は、周波数毎のエネルギーの時間重心を表す群遅延という表現において発見されたものであるが、その後、時刻ごとの周波数の平均である瞬時周波数にも、パワースペクトルも同様に成立する、基本的原理であることが明らかとなった。そのため、これらの新しい表現に基づく、処理機構の実装を目標として、新しい研究課題の提案に至った。これは、当初計画を大きく凌ぐ重要な成果である。
現在までの達成度 (段落)	26年度が最終年度であるため、記入しない。
今後の研究の推進方策	26年度が最終年度であるため、記入しない。
次年度使用額が生じた理由	26年度が最終年度であるため、記入しない。
次年度使用額の使用計画	26年度が最終年度であるため、記入しない。

研究成果
(49件)

すべて 2015 2014 その他

すべて雑誌論文 (3件) (うち査読あり 3件、オープンアクセス 1件、謝辞記載あり 3件) 学会発表 (43件) (うち招待講演 5件) 図書 (1件) 備考 (2件)

[雑誌論文] CheapTrick, a spectral envelope estimator for high-quality speech synthesis2015
- 著者名/発表者名
  Masanori Morise
- 雑誌名
  
  Speech Communication
  
  巻: 67 ページ: 1-7
- DOI
  10.1016/j.specom2014.09.003
- 査読あり / オープンアクセス / 謝辞記載あり
[雑誌論文] 音声の実時間表示とモーフィングで探る声の多様性2014
- 著者名/発表者名
  河原英紀
- 雑誌名
  
  音声研究
  
  巻: 18 ページ: 578-588
- 査読あり / 謝辞記載あり
[雑誌論文] Muffled and brisk speech evaluation with criterion based on temporal differentiation of vocal tract area function2014
- 著者名/発表者名
  Masanori Morise, Satoshi Tsuzuki, Hideki Banno, Kenji Ozawa
- 雑誌名
  
  IEICE transactions on information and systems
  
  巻: E97-D ページ: 3230-3233
- 査読あり / 謝辞記載あり
[学会発表] 対数周波数領域における高調波成分抑圧処理に基づく多重音の基本周波数推定手法に関する検討2015
- 著者名/発表者名
  高島田良介, 坂野秀樹, 旭健作
- 学会等名
  日本音響学会2015年春季研究発表会
- 発表場所
  中央大学、東京
- 年月日
  2015-03-16 – 2015-03-18
[学会発表] 残響環境下における動的特徴の強調による音声の明瞭性向上手法に関する評価2015
- 著者名/発表者名
  田邊将也, 坂野秀樹, 旭健作
- 学会等名
  日本音響学会2015年春季研究発表会
- 発表場所
  中央大学、東京
- 年月日
  2015-03-16 – 2015-03-18
[学会発表] 声道断面積関数を用いた様々な英語発声の声道形状に関する調査2015
- 著者名/発表者名
  近藤崇彰, 坂野秀樹, 旭健作
- 学会等名
  日本音響学会2015年春季研究発表会
- 発表場所
  中央大学、東京
- 年月日
  2015-03-16 – 2015-03-18
[学会発表] 声道断面積関数の変換による鼻声の声質改善手法に関する検討2015
- 著者名/発表者名
  牧野奨平, 坂野秀樹, 旭健作
- 学会等名
  日本音響学会2015年春季研究発表会
- 発表場所
  中央大学、東京
- 年月日
  2015-03-16 – 2015-03-18
[学会発表] スペクトル変動量を用いたスキャットの歌唱音声合成音の自然性向上手法に関する検討2015
- 著者名/発表者名
  谷澤啓介, 坂野秀樹, 旭健作
- 学会等名
  日本音響学会2015年春季研究発表会
- 発表場所
  中央大学、東京
- 年月日
  2015-03-16 – 2015-03-18
[学会発表] 音声入力による韻律制御機能を有するHMM音声合成システムの改良2015
- 著者名/発表者名
  西垣友理, 高道慎之介, 戸田智基, Graham Neubig, Sakriani Sakti, 中村哲
- 学会等名
  日本音響学会2015年春季研究発表会
- 発表場所
  中央大学、東京
- 年月日
  2015-03-16 – 2015-03-18
[学会発表] 非可聴つぶやき強調音声の雑音環境下における明瞭性改善に関する検討2015
- 著者名/発表者名
  鶴田さくら, 田中宏, 戸田智基, Graham Neubig, Sakriani Sakti, 中村哲
- 学会等名
  日本音響学会2015年春季研究発表会
- 発表場所
  中央大学、東京
- 年月日
  2015-03-16 – 2015-03-18
[学会発表] 差分スペクトル補正に基づく歌声声質変換におけるパラメータ生成法に関する調査2015
- 著者名/発表者名
  小林和弘, 戸田智基, Graham Neubig, Sakriani Sakti, 中村哲
- 学会等名
  日本音響学会2015年春季研究発表会
- 発表場所
  中央大学、東京
- 年月日
  2015-03-16 – 2015-03-18
[学会発表] よくわからないSTRAIGHT2015
- 著者名/発表者名
  森勢将雅
- 学会等名
  日本音響学会2015年春季研究発表会
- 発表場所
  中央大学、東京
- 年月日
  2015-03-16 – 2015-03-18
- 招待講演
[学会発表] 周期信号の短時間Fourier変換に基づく静的表現と音声分析合成系への応用について2015
- 著者名/発表者名
  河原英紀，森勢将雅，坂野秀樹，戸田智基，榊原健一，入野俊夫
- 学会等名
  日本音響学会2015年春季研究発表会
- 発表場所
  中央大学、東京
- 年月日
  2015-03-16 – 2015-03-18
[学会発表] 音声の好感度に対する声道形状および音源情報操作の効果について2015
- 著者名/発表者名
  吉元照貴，西村竜一，入野俊夫，河原英紀
- 学会等名
  日本音響学会2015年春季研究発表会
- 発表場所
  中央大学、東京
- 年月日
  2015-03-16 – 2015-03-18
[学会発表] 声道形状と声帯音源特性を利用したグロウル系歌唱音声への変換について2015
- 著者名/発表者名
  溝渕翔平，西村竜一，入野俊夫，河原英紀
- 学会等名
  日本音響学会2015年春季研究発表会
- 発表場所
  中央大学、東京
- 年月日
  2015-03-16 – 2015-03-18
[学会発表] 声道断面積関数推定における声帯音源特性の補償について2015
- 著者名/発表者名
  伊佐衣代，西村竜一，入野俊夫
- 学会等名
  日本音響学会2015年春季研究発表会
- 発表場所
  中央大学、東京
- 年月日
  2015-03-16 – 2015-03-18
[学会発表] 音声の高域強調処理による寸法知覚特性変化と計算理論について2015
- 著者名/発表者名
  山本航大，入野俊夫，西村竜一，河原英紀，Roy D. Patterson
- 学会等名
  日本音響学会聴覚研究会
- 発表場所
  札幌、北海道
- 年月日
  2015-03-02 – 2015-03-03
[学会発表] 声道形状と声帯音源特性を用いたグロウル歌唱音声への実時間変換の提案2015
- 著者名/発表者名
  溝渕翔平, 西村竜一, 入野俊夫, 河原英紀
- 学会等名
  第106回音楽情報科学・第35回エンタテインメントコンピューティング合同研究発表会
- 発表場所
  甲府、山梨
- 年月日
  2015-03-02 – 2015-03-03
[学会発表] 音声の好感度改善補助ツールの開発を目指した好感度改善方法の検討2015
- 著者名/発表者名
  吉元照貴, 西村竜一, 入野俊夫, 河原英紀
- 学会等名
  第106回音楽情報科学・第35回エンタテインメントコンピューティング合同研究発表会
- 発表場所
  甲府、山梨
- 年月日
  2015-03-02 – 2015-03-03
[学会発表] 高次対称性に基づく基本周波数推定法のモデル化と filled pauseの分析への応用について2015
- 著者名/発表者名
  河原英紀, 西村竜一, 入野俊夫
- 学会等名
  電子情報通信学会／日本音響学会音声研究会
- 発表場所
  石垣島、沖縄
- 年月日
  2015-03-02 – 2015-03-03
[学会発表] Speech Analysis Modification and Synthesis tool STRAIGHT and extended voice morphing2015
- 著者名/発表者名
  Hideki Kawahara
- 学会等名
  ARO midwinter meeting
- 発表場所
  Baltimore
- 年月日
  2015-02-21 – 2015-02-25
- 招待講演
[学会発表] 音声入力に基づく韻律制御機能を有するHMM音声合成システム2014
- 著者名/発表者名
  西垣友理, 高道慎之介, 戸田智基, Graham Neubig, Sakriani Sakti, 中村哲
- 学会等名
  電子情報通信学会／日本音響学会音声研究会
- 発表場所
  東京工業大学、東京
- 年月日
  2014-12-15 – 2014-12-16
[学会発表] Excitation source design for high-quality speech manipulation systems based on a temporally static group delay representation of periodic signals2014
- 著者名/発表者名
  Hideki Kawahara, Masanori Morise, Ken-Ichi Sakakibara, Tomoki Toda, Hideki Banno Ryuichi Nisimura, Toshio Irino
- 学会等名
  APSIPA ASC 2014
- 発表場所
  Siem Reap, Cambodia
- 年月日
  2014-12-09 – 2014-12-12
[学会発表] An inter-speaker evaluation through simulation of electrolarynx control based on statistical F0 prediction2014
- 著者名/発表者名
  Kou Tanaka, Tomoki Toda, Graham Neubig, Sakriani Sakti, Satoshi Nakamura
- 学会等名
  APSIPA ASC 2014
- 発表場所
  Siem Reap, Cambodia
- 年月日
  2014-12-09 – 2014-12-12
[学会発表] STRAIGHT speech analysis: Tutorial2014
- 著者名/発表者名
  Hideki Kawahara
- 学会等名
  APSIPA ASC 2014
- 発表場所
  Siem Reap, Cambodia
- 年月日
  2014-12-09 – 2014-12-12
- 招待講演
[学会発表] 高品質な歌声・音声合成を目的としたスペクトル包絡推定法CheapTrickの誤差評価2014
- 著者名/発表者名
  森勢将雅
- 学会等名
  情報処理学会音楽情報科学研究会
- 発表場所
  筑波大学、茨城
- 年月日
  2014-11-20 – 2014-11-21
[学会発表] 雑音環境下における明瞭性に着目した非可聴つぶやき強調処理における目標音声の評価2014
- 著者名/発表者名
  鶴田さくら, 田中宏, 戸田智基, Graham Neubig, Sakriani sakti, 中村哲
- 学会等名
  電子情報通信学会／日本音響学会音声研究会
- 発表場所
  九州大学、福岡
- 年月日
  2014-11-13 – 2014-11-14
[学会発表] ソース・フィルタ型音声合成における有声音の位相が聴覚野の神経細胞応答に与える影響について　～覚醒ネコ第一次聴覚野の神経細胞応答に基づく検討～2014
- 著者名/発表者名
  森勢将雅，大久保快走，地本宗平，佐藤悠，小澤賢司
- 学会等名
  電子情報通信学会／日本音響学会音声研究会
- 発表場所
  九州大学、福岡
- 年月日
  2014-11-13 – 2014-11-14
[学会発表] 周期信号の静的表現に基づく音声処理2014
- 著者名/発表者名
  河原英紀
- 学会等名
  電子情報通信学会／日本音響学会音声研究会
- 発表場所
  白浜、和歌山
- 年月日
  2014-10-23 – 2014-10-24
- 招待講演
[学会発表] 基本周波数系列のケプストラムを用いたビブラートの速さを反映する距離尺度の検討2014
- 著者名/発表者名
  鈴木千文, 坂野秀樹, 旭健作, 森勢将雅
- 学会等名
  電子情報通信学会／日本音響学会音声研究会
- 発表場所
  白浜、和歌山
- 年月日
  2014-10-23 – 2014-10-24
[学会発表] TANDEM-STRAIGHTの種々のデバイスへの実装と評価～スマートフォンからGPGPUまで～2014
- 著者名/発表者名
  坂野秀樹, 森勢将雅, 河原英紀
- 学会等名
  電子情報通信学会／日本音響学会音声研究会
- 発表場所
  白浜、和歌山
- 年月日
  2014-10-23 – 2014-10-24
[学会発表] 声道断面積関数を用いた英語発声における母語の違いによる声道形状の違いの調査2014
- 著者名/発表者名
  近藤崇彰，坂野秀樹，旭　健作
- 学会等名
  電子情報通信学会／日本音響学会音声研究会
- 発表場所
  白浜、和歌山
- 年月日
  2014-10-23 – 2014-10-24
[学会発表] 残響環境下における動的特徴の強調による音声の明瞭性向上手法に関する検討2014
- 著者名/発表者名
  田邊将也，坂野秀樹，旭　健作
- 学会等名
  電子情報通信学会／日本音響学会音声研究会
- 発表場所
  白浜、和歌山
- 年月日
  2014-10-23 – 2014-10-24
[学会発表] 音声分析合成系を用いた声道断面積関数に基づく鼻声の声質改善手法に関する検討2014
- 著者名/発表者名
  牧野奨平，坂野秀樹，旭　健作
- 学会等名
  電子情報通信学会／日本音響学会音声研究会
- 発表場所
  白浜、和歌山
- 年月日
  2014-10-23 – 2014-10-24
[学会発表] テンポの影響を考慮したスキャットの歌唱音声合成音の自然性向上に関する検討2014
- 著者名/発表者名
  谷澤啓介，坂野秀樹，旭　健作
- 学会等名
  電子情報通信学会／日本音響学会音声研究会
- 発表場所
  白浜、和歌山
- 年月日
  2014-10-23 – 2014-10-24
[学会発表] 線形予測分析を用いた声道断面積関数推定のための前処理の検討2014
- 著者名/発表者名
  伊佐衣代，吉元照貴，西村竜一，入野俊夫，河原英紀
- 学会等名
  電子情報通信学会／日本音響学会音声研究会
- 発表場所
  白浜、和歌山
- 年月日
  2014-10-23 – 2014-10-24
[学会発表] グロウル系歌唱から求められる声道断面積関数の特徴について2014
- 著者名/発表者名
  溝渕翔平，伊佐衣代，西村竜一，入野俊夫，河原英紀
- 学会等名
  電子情報通信学会／日本音響学会音声研究会
- 発表場所
  白浜、和歌山
- 年月日
  2014-10-23 – 2014-10-24
[学会発表] Excitation source analysis for high-quality speech manipulation systems based on an interference-free representation of group delay with minimum phase response compensation2014
- 著者名/発表者名
  Hideki Kawahara, Masanori Morise, Tomoki Toda, Hideki Banno Ryuichi Nisimura, Toshio Irino
- 学会等名
  Interspeech 2014
- 発表場所
  Singapore
- 年月日
  2014-09-14 – 2014-09-18
[学会発表] Vocal tract length estimation based on vowels using a database consisting of 385 speakers and a database with MRI-based vocal tract shape information2014
- 著者名/発表者名
  Hideki Kawahara, Tatsuya Kitamura, Hironori Takemoto, Ryuichi Nisimura, Toshio Irino
- 学会等名
  Interspeech 2014
- 発表場所
  Singapore
- 年月日
  2014-09-14 – 2014-09-18
[学会発表] 声道形状と音源情報に注目した音声の好感度改善システムの検討について2014
- 著者名/発表者名
  吉元照貴,伊佐衣代,溝渕翔平,西村竜一,入野俊夫,河原英紀
- 学会等名
  日本音響学会2014年秋季研究発表会
- 発表場所
  札幌、北海道
- 年月日
  2014-09-03 – 2014-09-05
[学会発表] 線形予測分析を用いた声道断面積関数推定のための前処理について2014
- 著者名/発表者名
  伊佐衣代,西村竜一,入野俊夫,河原英紀
- 学会等名
  日本音響学会2014年秋季研究発表会
- 発表場所
  札幌、北海道
- 年月日
  2014-09-03 – 2014-09-05
[学会発表] 周期信号の群遅延の静的表現と音声の非周期成分への応用について2014
- 著者名/発表者名
  河原英紀,森勢将雅,榊原健一,戸田智基,坂野秀樹,西村竜一,入野俊夫
- 学会等名
  日本音響学会2014年秋季研究発表会
- 発表場所
  札幌、北海道
- 年月日
  2014-09-03 – 2014-09-05
[学会発表] オープンソース音声合成システムWORLDの現状と課題2014
- 著者名/発表者名
  森勢将雅
- 学会等名
  音学シンポジウム2014
- 発表場所
  日本大学、東京
- 年月日
  2014-05-24 – 2014-05-25
[学会発表] 音声・聴覚の理解と信号処理2014
- 著者名/発表者名
  河原英紀
- 学会等名
  音学シンポジウム2014
- 発表場所
  日本大学、東京
- 年月日
  2014-05-24 – 2014-05-25
- 招待講演
[学会発表] 歌声にグロウルの味を加える GUI について2014
- 著者名/発表者名
  溝渕翔平, 西村竜一, 入野俊夫, 河原英紀
- 学会等名
  音学シンポジウム2014
- 発表場所
  日本大学、東京
- 年月日
  2014-05-24 – 2014-05-25
[学会発表] ささやき声からの寸法知覚の手がかり獲得と保持について2014
- 著者名/発表者名
  山本航大, 入野俊夫,西村竜一, 河原英紀
- 学会等名
  音学シンポジウム2014
- 発表場所
  日本大学、東京
- 年月日
  2014-05-24 – 2014-05-25
[図書] Speech Prosody in Speech Synthesis: Modeling and generation of prosody for high quality and flexible speech synthesis2015
- 著者名/発表者名
  Hideki Kawahara
- 総ページ数
  213
- 出版者
  Springer Berlin Heidelberg
[備考] Matlab realtime speech tools
- URL
  http://www.wakayama-u.ac.jp/~kawahara/MatlabRealtimeSpeechTools/
[備考] 音声分析変換合成法STRAIGHT
- URL
  http://www.wakayama-u.ac.jp/~kawahara/STRAIGHTadv/index_j.html

2014 年度 実績報告書

聴覚の情報表現に基づく高度音声分析変換合成方式の研究

研究代表者

河原 英紀 和歌山大学, システム工学部, 教授 (40294300)

研究成果

[雑誌論文] CheapTrick, a spectral envelope estimator for high-quality speech synthesis2015

著者名/発表者名

雑誌名

DOI

[雑誌論文] 音声の実時間表示とモーフィングで探る声の多様性2014

著者名/発表者名

雑誌名

[雑誌論文] Muffled and brisk speech evaluation with criterion based on temporal differentiation of vocal tract area function2014

著者名/発表者名

雑誌名

[学会発表] 対数周波数領域における高調波成分抑圧処理に基づく多重音の基本周波数推定手法に関する検討2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 残響環境下における動的特徴の強調による音声の明瞭性向上手法に関する評価2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 声道断面積関数を用いた様々な英語発声の声道形状に関する調査2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 声道断面積関数の変換による鼻声の声質改善手法に関する検討2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] スペクトル変動量を用いたスキャットの歌唱音声合成音の自然性向上手法に関する検討2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音声入力による韻律制御機能を有するHMM音声合成システムの改良2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 非可聴つぶやき強調音声の雑音環境下における明瞭性改善に関する検討2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 差分スペクトル補正に基づく歌声声質変換におけるパラメータ生成法に関する調査2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] よくわからないSTRAIGHT2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 周期信号の短時間Fourier変換に基づく静的表現と音声分析合成系への応 用について2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音声の好感度に対する声道形状および音源情報操作の効果について2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 声道形状と声帯音源特性を利用したグロウル系歌唱音声への変換につい て2015

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 声道断面積関数推定における声帯音源特性の補償について2015

著者名/発表者名

学会等名

発表場所

年月日

2014 年度実績報告書

河原英紀和歌山大学, システム工学部, 教授 (40294300)

[学会発表] 周期信号の短時間Fourier変換に基づく静的表現と音声分析合成系への応用について2015

[学会発表] 声道形状と声帯音源特性を利用したグロウル系歌唱音声への変換について2015

[学会発表] 雑音環境下における明瞭性に着目した非可聴つぶやき強調処理における目標音声の評価2014

[学会発表] ソース・フィルタ型音声合成における有声音の位相が聴覚野の神経細胞応答に与える影響について　～覚醒ネコ第一次聴覚野の神経細胞応答に基づく検討～2014