2005 年度実績報告書

音声対話システムにおける非言語音声情報の検出と音声認識の高精度化

研究課題

研究課題/領域番号	16700195
研究機関	福岡大学
研究代表者	高橋伸弥福岡大学, 工学部, 助手 (40330899)
キーワード	咳検出 / 非言語音 / 咳払い認識 / 音声認識 / 言語モデル / 擬音語モデル
研究概要	本研究は、音声対話システムにおける音声認識精度の高精度化と非言語音声情報の積極的な利用を目的として、音声発話中から非言語音を検出する方法について検討したものである。本年度は、昨年度にひきつづき、非言語音を擬似音素系列として近似的に表現するモデルを検討した。基本的なアイデアは、人間が非言語音を擬音語として表現しているのと同様の処理を計算機に行わせようというものである。具体的には、非言語音を音素認識することにより得られる音素系列群に対してクラスタリング処理を行うことで代表的な擬似音素系列を選択し、これを発話辞書に登録することで、既存の音声認識の枠組みの中で音声発話中の非言語音を認識する。まず始めに非言語音の中でも咳および咳払いを対象として音素認識を行った。その結果、咳および咳払いの波形が母音/u/、促音/q/、無声破裂音/p/として認識されることが確認できた。さらに認識結果の音素系列をクラスタリングし、その中心パターンで咳および咳払いをモデル化した。これらの擬似音素モデルを用いた認識実験を行った結果、前年度に検討した咳HMMによるモデルと比較して、単語正解率、咳正解率の総合で約20%の改善率を得ることができた。以上の研究成果を国際会議および国内の研究発表会等で発表した。また非言語音として咳・咳払い以外の音楽や環境音へと対象を拡大し、擬似音素モデルにより音声・非音声識別を行うことを試み、実験により有効性を確認した。一般的な非言語音への拡張に関しては、さらに多量のデータを収集し、引き続き次年度において検討を行う予定である。

研究成果
(2件)

すべて雑誌論文 (2件)

[雑誌論文] Detection of Coughs from User Utterances Using Imitated Phoneme Model2005
- 著者名/発表者名
  S.Takahashi, et al.
- 雑誌名
  
  Proc.of the EUROSPEECH
  
  ページ: 1357-1360
[雑誌論文] 擬似単語モデルによる非言語音声の認識2005
- 著者名/発表者名
  高橋伸弥他
- 雑誌名
  
  信学技報 NLC2005-21
  
  ページ: 55-60