高次統計量追跡に基づくハンズフリー音声対話システムの教師なし自律最適化

研究課題

研究課題/領域番号	13J05110
研究種目	特別研究員奨励費
配分区分	補助金
応募区分	国内
研究分野	メディア情報学・データベース
研究機関	奈良先端科学技術大学院大学
研究代表者	宮﨑亮一奈良先端科学技術大学院大学, 情報科学研究科, 特別研究員(DC2)
研究期間 (年度)	2013
研究課題ステータス	完了 (2013年度)
配分額 *注記	1,000千円 (直接経費: 1,000千円) 2013年度: 1,000千円 (直接経費: 1,000千円)
キーワード	ブラインド音声抽出 / ミュージカルノイズ / 高次統計量 / マイクロホンアレー
研究概要	本研究は, 音声強調部と音響モデル・言語モデルなどの音声認識部を含めたハンズフリー音声対話システムを想定し, システム全体の統合的な自律的最適化を行うことを目的とするものである. 音声対話システムは様々な環境で運用されることより, 各環境に応じて最高の音声認識性能を引き出すために, 手作業での調整を余儀なくされている. そこで, 音声強調部の内部パラメータに対応する音声認識率を予測する理論を確立する. さらに, それに基づき, 音声認識率が最も高くなるように内部パラメータを自動的に最適化する. 音声認識性能を左右する要因の一つは「SN比の改善量」であることは以前より広く知られているが, この要素は目的音声に混入される雑音の「量」に関するもので, 「質」に関しては評価していない. 音声認識性能の良し悪しは「SN比の改善量」に加えて, 音声強調後の「雑音の品質」・「音声の品質」によっても決定される. そのため, これら三要素の値を事前に算出することが出来れば, それに対応する音声認識率を予測できると考えられ, かっ最も音声認識率が高くなるような内部パラメータの自動最適化にっながる. これまでに, 私は, 「音声の品質」を評価するための高次統計量についての検討を行ってきた. 目的音声に混入する背景雑音の種類が定常か非定常か, また, SN比の良し悪しによっても音声の統計量を安定的に求める手法は異なることを明らかにした. この結果は, 「音声の品質」を評価する上で安定して統計量を求めることが出来るという意味で大きな成果であり, 今後の研究につながると言える.
今後の研究の推進方策	(抄録なし)

報告書

(1件)

2013 実績報告書

研究成果
(3件)

すべて 2014 2013

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (2件)

[雑誌論文] Musical-Noise-Free Blind Speech Extraction Integrating Microphone Array and Iterative Spectral Subtraction2014
- 著者名/発表者名
  Ryoichi Miyazaki, Hiroshi Saruw atari, Satoshi Nakamura, Kiyohiro Shikano, Kazunobu Kondo, J onathan Blanchette, Martin Bou chard
- 雑誌名
  
  Signal Processing
  
  巻: (印刷中)
- 関連する報告書
  2013 実績報告書
- 査読あり
[学会発表] Toward Musical-Noise-Free Blind Speech Extraction : Concept and Its Applications2013
- 著者名/発表者名
  Ryoichi Miyazaki
- 学会等名
  APSIPA Annual Summit and Conference 2013
- 発表場所
  Kaohsiung, Taiwan
- 年月日
  2013-10-30
- 関連する報告書
  2013 実績報告書
[学会発表] 様々なミュージカルノイズフリー音声強調法における音質評価2013
- 著者名/発表者名
  宮﨑亮一
- 学会等名
  日本音響学会
- 発表場所
  愛知県豊橋市
- 年月日
  2013-09-26
- 関連する報告書
  2013 実績報告書

高次統計量追跡に基づくハンズフリー音声対話システムの教師なし自律最適化

研究代表者

宮﨑 亮一 奈良先端科学技術大学院大学, 情報科学研究科, 特別研究員(DC2)

1,000千円 (直接経費: 1,000千円)

報告書

研究成果

[雑誌論文] Musical-Noise-Free Blind Speech Extraction Integrating Microphone Array and Iterative Spectral Subtraction2014

著者名/発表者名

雑誌名

関連する報告書

[学会発表] Toward Musical-Noise-Free Blind Speech Extraction : Concept and Its Applications2013

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 様々なミュージカルノイズフリー音声強調法における音質評価2013

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

宮﨑亮一奈良先端科学技術大学院大学, 情報科学研究科, 特別研究員(DC2)