• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2007 Fiscal Year Annual Research Report

シングルマイクロフォンによる発話区間検出及び音源方向推定の研究

Research Project

Project/Area Number 19700170
Research InstitutionKobe University

Principal Investigator

滝口 哲也  Kobe University, 自然科学糸先端融合研究環都市安全研究センター, 講師 (40397815)

Keywords音声認識 / 音源方向推定 / 雑音除去
Research Abstract

発話者方向推定を行うためには,まず観測信号が音声か非音声かを判定する必要がある.平成19年度においては,音声・非音声の識別を行う手法として,弱識別器を線形結合する事により高い識別率が実現可能なAdaBoostを用いた方法を提案した.さらに弱識別器にSVM(Support Vector Machine)を統合した新しい方法も提案し,統合による有効性を実験結果より示した.また実環境下においては,例えばドアの開閉音,電話の音など突発的な雑音が発生する事もあり,平成19年度において突発性雑音の除去についても検討した.具体的には,AdaBoostによる雑音識別器による結果と,音声の統計モデルであるGMM(Gaussian Mixture Model)を用いて,EM(Expectation Maximization)アルゴリズムとニュートン法による突発性雑音の除去手法を提案し,50種類の突発性雑音に対して音声認識実験を行い,提案手法の有効性を確認した.
次に得られた音声区間に対して発話者方向推定を行うために,コスト削減,システムの縮小化などを考慮して,単一(シングル)マイクロフオンのみを用いて実現する方法を検討した.具体的には,発話者の位置毎の音響伝達特性をあらかじめ推定しておき,各位置の音響伝達特性を判別することにより音源方向(位置)推定を行う.音響伝達特性の推定は,観測される音声信号に対して,音声の統計モデルであるGMNを用いて尤度最大化基準により音声と音響伝達特性を分離することにより実現した.特定話者に対して,3方向(位置)から到来する音声の識別実験を行い,1,000単語での評価結果,83%の正解精度を得る事が出来た.

  • Research Products

    (14 results)

All 2008 2007

All Journal Article (4 results) (of which Peer Reviewed: 4 results) Presentation (9 results) Book (1 results)

  • [Journal Article] Estimation of Sound Source Direction Using Parabolic Reflection Board2008

    • Author(s)
      Tetsuya Takiguchi
    • Journal Title

      International Workshop on Nonlinear Circuits and Signal Processing

      Pages: 9-12

    • Peer Reviewed
  • [Journal Article] Estimation of Room Acoustic Transfer Function Using Speech Model2007

    • Author(s)
      Tetsuya Takiguchi
    • Journal Title

      IEEE Statistical Signal Processing Workshop

      Pages: 336-340

    • Peer Reviewed
  • [Journal Article] Noise Detection and Classification in Speech Signals with Boosting2007

    • Author(s)
      Nobuyuki Miyake
    • Journal Title

      IEEE Statistical Signal Processing Workshop

      Pages: 778-782

    • Peer Reviewed
  • [Journal Article] PCA-Based Speech Enhancement for Distorted Speech Recognition2007

    • Author(s)
      Tetsuya Takiguchi
    • Journal Title

      Journal of Multimedia Vol. 2. Issue 5

      Pages: 13-18

    • Peer Reviewed
  • [Presentation] SVMとCARTの組み合わせによるAdaBoostを用いた音声区間検出2008

    • Author(s)
      松田博義
    • Organizer
      日本音響学会2008年春季研究発表会
    • Place of Presentation
      千葉工業大学
    • Year and Date
      2008-03-17
  • [Presentation] 単一マイクロホンを用いた音響伝達特性の尤度判定による音源位置推定2008

    • Author(s)
      住田雄司
    • Organizer
      日本音響学会2008年春季研究発表会
    • Place of Presentation
      千葉工業大学
    • Year and Date
      2008-03-17
  • [Presentation] パラボラ反射板を用いたナクティブマイクロフォンによる音源方向推定2008

    • Author(s)
      高島遼一
    • Organizer
      日本音響学会2008年春季研究発表会
    • Place of Presentation
      千葉工業大学
    • Year and Date
      2008-03-17
  • [Presentation] 音素部分空間の統合による音声特徴量抽出の検討2007

    • Author(s)
      朴玄信
    • Organizer
      第9回音声言語シンポジウム
    • Place of Presentation
      NTT京阪奈ビル
    • Year and Date
      2007-12-21
  • [Presentation] 弱識別器にSVMを用いたAdaBoostの検討2007

    • Author(s)
      松田博義
    • Organizer
      第9回音声言語シンポジウム
    • Place of Presentation
      NTT京阪奈ビル
    • Year and Date
      2007-12-20
  • [Presentation] 音声GMMと雑音重み推定を用いた雑音除去2007

    • Author(s)
      三宅信之
    • Organizer
      第9回音声言語シンポジウム
    • Place of Presentation
      NTT京阪奈ビル
    • Year and Date
      2007-12-20
  • [Presentation] 単一マイクロホンを用いた音響伝達特性の判別による音源方向推定の検討2007

    • Author(s)
      住田雄司
    • Organizer
      日本音響学会2007年秋季研究発表会
    • Place of Presentation
      山梨大学
    • Year and Date
      2007-09-21
  • [Presentation] 3次キュムラントバイスペクトラム特徴とReal AdaBoostによる音声区間検出2007

    • Author(s)
      松田博義
    • Organizer
      日本音響学会2007年秋季研究発表会
    • Place of Presentation
      山梨大学
    • Year and Date
      2007-09-19
  • [Presentation] 雑音重み推定と音声GMMを用いた既知雑音除去2007

    • Author(s)
      三宅信之
    • Organizer
      日本音響学会2007年秋季研究発表会
    • Place of Presentation
      山梨大学
    • Year and Date
      2007-09-19
  • [Book] Robust Speech Recognition and Understanding2007

    • Author(s)
      Tetsuya Takiguchi
    • Total Pages
      67-74
    • Publisher
      I-TECH Education and Publishing

URL: 

Published: 2010-02-04   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi