• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

音声対話システムにおける非言語音声情報の検出と音声認識の高精度化

研究課題

研究課題/領域番号 16700195
研究機関福岡大学

研究代表者

高橋 伸弥  福岡大学, 工学部, 助手 (40330899)

キーワード咳検出 / 非言語音 / 咳払い認識 / 音声認識 / 言語モデル / 擬音語モデル
研究概要

本研究は、音声対話システムにおける音声認識精度の高精度化と非言語音声情報の積極的な利用を目的として、音声発話中から非言語音を検出する方法について検討したものである。
本年度は、昨年度までに検討した咳検出機構を実際の対話システムへと応用するための対話ロボットのプロトタイプ作成を行った。このプロトタイプでは2つのマイクから入力された音の時間差から、到来方向を推定し、さらに画像処理による話者の顔検出を併用することで話者方向の推定をし、その方向に指向性マイクを向けることで音声認識精度の高精度化をはかるというものである。この際、雑音や物音などの音と咳やくしゃみなどの音を識別することができれば、自然な対話システムが実現できる。
また、非言語音を擬似音素系列として近似的に表現するモデルを構築する際に、クラスタリングの精度がモデルの性能を大きく左右することから、クラスタリング手法の1つであるスペクトラルクラスタリングについての検討を行った。スペクトラルクラスタリングは、対象データの類似度行列に対するラプラス行列を固有値分解して得られた固有ベクトルに基づき、データを分類する方法である。この方法を用いて、擬音語表現や記号等が含まれたWeb文書の分類実験を行い、従来手法の1つである最大距離クラスタリングと比較して、精度よくクラスタリングできることを確認した。さらに本手法を昨年度までに収集した擬似音素系列に対して適用し、咳モデルの構築を行つた。

  • 研究成果

    (2件)

すべて 2007 2006

すべて 雑誌論文 (2件)

  • [雑誌論文] Document Filtering Based on Spectral Clustering for Speech Recognition Language Model2007

    • 著者名/発表者名
      S.Takahashi, et al.
    • 雑誌名

      Proc. of The Int. Multi-Conf. of Engineers and Computer Scientists 2007 Vol. 1

      ページ: 393-398

  • [雑誌論文] 音源方向と顔画像による話者検出2006

    • 著者名/発表者名
      高橋 伸弥 他.
    • 雑誌名

      福岡大学工学集報 76号

      ページ: 26-30

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi