複数の共有構造を用いたアニーリングに基づく音響モデリング

研究課題

研究課題/領域番号	11J05301
研究種目	特別研究員奨励費
配分区分	補助金
応募区分	国内
研究分野	知覚情報処理・知能ロボティクス
研究機関	名古屋工業大学
研究代表者	塩田さやか名古屋工業大学, 工学研究科, 特別研究員(PD)
研究期間 (年度)	2011 – 2012
研究課題ステータス	完了 (2012年度)
配分額 *注記	1,300千円 (直接経費: 1,300千円) 2012年度: 600千円 (直接経費: 600千円) 2011年度: 700千円 (直接経費: 700千円)
キーワード	音声認識 / 音響モデリング / 複数のパラメータ共有構造 / 確定的アニーリング
研究概要	本研究では,複数のパラメータ共有構造を用い,確定的アニーリングEMアルゴリズムとベイズ基準を学習アルゴリズムに適用することで音声認識のための新しい音響モデリングの枠組みを提案する.初年度には,学習アルゴリズムの導出・実験及び考察を行い,国内外でその結果を発表してきた.今年度は提案法に関してさらに実験を重ねることで提案法の特徴や問題点等を考察・改善してきた.また,これまで提案法は音声認識に関しての統計的なモデリング手法として発表を行ってきているが,話者認識や音声合成といった統計モデルを基盤に用いる分野にも適用が可能である.そのため,話者認識や音声合成において提案法を適用するために,それぞれの最新の動向を調査し知見を広げるための研究活動も行った.話者認識に関しては,5ヶ月間エジンバラ大学の研究所に滞在し,話者認識の最新の動向や最新のデータ,問題点など様々な知見を得ることができた.また,海外の様々な分野の研究者とも議論を交わすことができ提案法に対する知見も深まった.さらに,音声合成の研究にも従事し,言語に依存しない話者の特徴をモデル化する研究を行ってきた.これにより話者性についての研究についても知識を深めることができ,かつ提案法の音声合成への適用についても検討することができた.今年度の研究活動の成果の国内外への発表件数は控えめではあるが,提案法について実験等をまとめ投稿した論文は採択され掲載されたため,当初の予定としては順調に進めることができたと言える.
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由研究計画において今年度は複数のパラメータ共有構造を用いた枠組みにベイズ基準を適応し,実験を通して考察し発展させること。さらには,他の分野においても適用について検討していくことを行った.それに関して発表するまでにはまだ至ってはいないものの,海外の研究機関で話者認識の最新の研究動向についての調査もでき,音声合成の研究も行ってきたため,研究計画の達成度としてはおおむね順調であると考えている.
今後の研究の推進方策	今後の推進方策としては,提案法の改善点について考察し,より生成モデルとして話者の真の分布に近くなるように改善,提案を行っていくことが挙げられる.また,今年度に行った他分野への適用に関しても研究を進め,国内外の学会や論文誌への投稿を通じてまとめあげていくことも考えられる.

報告書

(2件)

2012 実績報告書
2011 実績報告書

研究成果
(8件)

すべて 2013 2012 2011 その他

すべて雑誌論文 (2件) (うち査読あり 2件) 学会発表 (4件) 備考 (2件)

[雑誌論文] A Bayesian Framework Using Multiple Model Structures for Speech Recognition2013
- 著者名/発表者名
  Sayaka Shiota, Kei Hashimoto, Yoshihiko Nankaku, Keiichi Tokuda,
- 雑誌名
  
  IEICE Transactions on Information and Systems
  
  巻: E96.D 号: 4 ページ: 939-948
- DOI
  10.1587/transinf.E96.D.939
- NAID
  10031182859
- ISSN
  0916-8532, 1745-1361
- 関連する報告書
  2012 実績報告書
- 査読あり
[雑誌論文] Speech recognition based on statistical models including multiple phonetic decision trees2011
- 著者名/発表者名
  Sayaka Shiota, Kei Hashimoto, Yoshihiko Nankaku, Keiichi Tokuda
- 雑誌名
  
  Acoustical Science and Technology
  
  巻: 32 号: 6 ページ: 236-243
- DOI
  10.1250/ast.32.236
- NAID
  130001258012
- ISSN
  0369-4232, 1346-3969, 1347-5177
- 関連する報告書
  2011 実績報告書
- 査読あり
[学会発表] Cross-lingual speaker adaptation for HMM-based speech synthesis using joint-eigenvoices with a space of perceptual characteristics2013
- 著者名/発表者名
  Viviane de Franca Olivera, Sayaka shiota, Kei Hashimoto, Yoshihiko Nankaku, Keiichi Tokuda
- 学会等名
  日本音響学会
- 発表場所
  東京工科大学(東京都)
- 関連する報告書
  2012 実績報告書
[学会発表] Cross-lingual Speaker Adaptation for HMM-based speech synthesis using speaker interpolation based on perceptual characteristics2012
- 著者名/発表者名
  Viviane de Franca Oliveira, Sayaka Shiota, Yoshihiko Nankaku, Keiichi Tokuda
- 学会等名
  日本音響学会
- 発表場所
  神奈川大学(神奈川県)
- 年月日
  2012-03-15
- 関連する報告書
  2011 実績報告書
[学会発表] 個人性を考慮した異言語音声合成に対する知覚評価2012
- 著者名/発表者名
  津崎実, 徳田恵一, 河井恒, 志賀芳則, 大浦圭一郎, 塩田さやか
- 学会等名
  音声研究会(信学技報)
- 発表場所
  NTT厚木研究開発センター(神奈川県)
- 関連する報告書
  2012 実績報告書
[学会発表] Cross-lingual Speaker Adaptation for HMM-based Speech Synthesis Using Speaker Interpolation Based on Perceptual Characteristics2012
- 著者名/発表者名
  Viviane de Franca Olivera, Sayaka shiota, Yoshihiko Nankaku, Keiichi Tokuda
- 学会等名
  Interspeech2012
- 発表場所
  ポートランド
- 関連する報告書
  2012 実績報告書
[備考]
- URL
  http://www.ism.ac.jp/~sayaka/
- 関連する報告書
  2012 実績報告書
[備考]
- URL
  http://www.sp.nitech.ac.jp/~sayaka
- 関連する報告書
  2011 実績報告書

複数の共有構造を用いたアニーリングに基づく音響モデリング

研究代表者

塩田 さやか 名古屋工業大学, 工学研究科, 特別研究員(PD)

1,300千円 (直接経費: 1,300千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] A Bayesian Framework Using Multiple Model Structures for Speech Recognition2013

著者名/発表者名

雑誌名

DOI

NAID

ISSN

関連する報告書

[雑誌論文] Speech recognition based on statistical models including multiple phonetic decision trees2011

著者名/発表者名

雑誌名

DOI

NAID

ISSN

関連する報告書

[学会発表] Cross-lingual speaker adaptation for HMM-based speech synthesis using joint-eigenvoices with a space of perceptual characteristics2013

著者名/発表者名

学会等名

発表場所

関連する報告書

[学会発表] Cross-lingual Speaker Adaptation for HMM-based speech synthesis using speaker interpolation based on perceptual characteristics2012

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 個人性を考慮した異言語音声合成に対する知覚評価2012

著者名/発表者名

学会等名

発表場所

関連する報告書

[学会発表] Cross-lingual Speaker Adaptation for HMM-based Speech Synthesis Using Speaker Interpolation Based on Perceptual Characteristics2012

著者名/発表者名

学会等名

発表場所

関連する報告書

[備考]

URL

関連する報告書

[備考]

URL

関連する報告書

塩田さやか名古屋工業大学, 工学研究科, 特別研究員(PD)