• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

音声対話システムにおける非言語音声情報の検出と音声認識の高精度化

Research Project

Project/Area Number 16700195
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field Perception information processing/Intelligent robotics
Research InstitutionFukuoka University

Principal Investigator

高橋 伸弥  福岡大学, 工学部, 助手 (40330899)

Project Period (FY) 2004 – 2006
Project Status Completed (Fiscal Year 2006)
Budget Amount *help
¥2,600,000 (Direct Cost: ¥2,600,000)
Fiscal Year 2006: ¥800,000 (Direct Cost: ¥800,000)
Fiscal Year 2005: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 2004: ¥1,100,000 (Direct Cost: ¥1,100,000)
Keywords咳検出 / 非言語音 / 咳払い認識 / 音声認識 / 言語モデル / 擬音語モデル / 音声対話システム / 音響モデル
Research Abstract

本研究は、音声対話システムにおける音声認識精度の高精度化と非言語音声情報の積極的な利用を目的として、音声発話中から非言語音を検出する方法について検討したものである。
本年度は、昨年度までに検討した咳検出機構を実際の対話システムへと応用するための対話ロボットのプロトタイプ作成を行った。このプロトタイプでは2つのマイクから入力された音の時間差から、到来方向を推定し、さらに画像処理による話者の顔検出を併用することで話者方向の推定をし、その方向に指向性マイクを向けることで音声認識精度の高精度化をはかるというものである。この際、雑音や物音などの音と咳やくしゃみなどの音を識別することができれば、自然な対話システムが実現できる。
また、非言語音を擬似音素系列として近似的に表現するモデルを構築する際に、クラスタリングの精度がモデルの性能を大きく左右することから、クラスタリング手法の1つであるスペクトラルクラスタリングについての検討を行った。スペクトラルクラスタリングは、対象データの類似度行列に対するラプラス行列を固有値分解して得られた固有ベクトルに基づき、データを分類する方法である。この方法を用いて、擬音語表現や記号等が含まれたWeb文書の分類実験を行い、従来手法の1つである最大距離クラスタリングと比較して、精度よくクラスタリングできることを確認した。さらに本手法を昨年度までに収集した擬似音素系列に対して適用し、咳モデルの構築を行つた。

Report

(3 results)
  • 2006 Annual Research Report
  • 2005 Annual Research Report
  • 2004 Annual Research Report
  • Research Products

    (8 results)

All 2007 2006 2005 2004

All Journal Article (8 results)

  • [Journal Article] Document Filtering Based on Spectral Clustering for Speech Recognition Language Model2007

    • Author(s)
      S.Takahashi, et al.
    • Journal Title

      Proc. of The Int. Multi-Conf. of Engineers and Computer Scientists 2007 Vol. 1

      Pages: 393-398

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 音源方向と顔画像による話者検出2006

    • Author(s)
      高橋 伸弥 他.
    • Journal Title

      福岡大学工学集報 76号

      Pages: 26-30

    • NAID

      110004076335

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Detection of Coughs from User Utterances Using Imitated Phoneme Model2005

    • Author(s)
      S.Takahashi, et al.
    • Journal Title

      Proc.of the EUROSPEECH

      Pages: 1357-1360

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 擬似単語モデルによる非言語音声の認識2005

    • Author(s)
      高橋 伸弥 他
    • Journal Title

      信学技報 NLC2005-21

      Pages: 55-60

    • NAID

      110003278943

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 発話中からの咳払いの検出2005

    • Author(s)
      高橋伸弥
    • Journal Title

      電子情報通信学会2005年総合大会講演論文集

      Pages: 137-137

    • Related Report
      2004 Annual Research Report
  • [Journal Article] 健康管理支援のための咳検出システム2004

    • Author(s)
      高橋伸弥
    • Journal Title

      福岡大学工学集報 No.73

      Pages: 15-20

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Cough Detection in Spoken Dialogue System for Home Health Care2004

    • Author(s)
      S.Takahashi
    • Journal Title

      Proceedings of the International Conference on Spoken Language Processing 2004

      Pages: 1865-1868

    • Related Report
      2004 Annual Research Report
  • [Journal Article] 健康管理支援システムのための咳検出方法の検討2004

    • Author(s)
      高橋伸弥
    • Journal Title

      日本音響学会2005年秋季研究発表会講演論文集

      Pages: 73-73

    • Related Report
      2004 Annual Research Report

URL: 

Published: 2004-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi