• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2009 Fiscal Year Annual Research Report

時変複素音声分析を用いた周囲雑音に頑健な基本周波数推定とIP電話、楽音への応用

Research Project

Project/Area Number 20500158
Research InstitutionUniversity of the Ryukyus

Principal Investigator

舟木 慶一  University of the Ryukyus, 総合情報処理センター, 講師 (30315486)

Keywords音声のFO推定 / 解析信号 / 複素音声分析 / ロバスト分析 / 音声符号化 / iLBC / G.711.1 / ALS
Research Abstract

人間が発声する声の高さである音声の基本周波数(FO)の正確かつ信頼できる推定は、音声符号化や音声強調などの音声処理における重要な要素技術である。しかし、これらの音声処理は雑音環境下で用いられるため、周囲雑音によりFOの推定精度は劣化し、音声処理の性能も劣化する。したがって、周囲雑音すなわち加法性の雑音に頑健な、FO推定アルゴリズムが必要とされている。本研究では、周囲雑音にも頑健な音声のFO推定方式の高精度化と、IP電話と楽音への応用を行う。具体的な方法論として、研究代表者が研究している解析信号に対するロバスト時変複素音声分析を用いて、各サンプルでのスペクトルを推定し、スペクトルのピーク推定によりFOやフォルマントを推定する。推定されたFOやF1(第1フォルマント)を予備選択値として、既に提案した自己相関/AMDFを用いるフレームベース方式により精密な推定を行う。また、フォルマント推定性能の評価も行う。さらに、音声符号化、楽音の多重ピッチ解析、パケットロス隠蔽への適用も行う。
2009年度は、ピーク推定によるFO推定を音声符号化方式に適用した。Skype用に開発されたIETF iLBC(internet low bit rate codec)音声符号化方式に適用した。iLBC方式はLPCボコーダに基づく音声符号化方式で、音源を3段の適応コードブックで量子化している。1段目の適応コードブックの予備選択として、ピーク推定方式の推定値を用いた。その結果、よりバラつきの小さな遅延値の推定が行われ、音質の向上も確認された。この成果を、2010年3月に電通大で開催された音響学会春季研究発表会にて報告した。さらに、ロバスト複素音声分析の音声符号化への応用として、ITU-T G.711.1音声符号化方式の聴感重み付けフィルタへの適用とISO/IEC MPEG-4 ALS(オーディオロスレス)符号化の残差算出への適用を行い、評価をおこなった。ALSに関しては、実数分析で効果が確認されたが、複素分析やロバスト分析の効果は確認されなかった。この研究成果を、2009年6,月に北海道大学で開催された音声研究会と2010年2月にInnsbruckで開催されたIASTED SPPRA2010にて報告した。G.711.1に関しては、若干の音質向上が確認された。この研究成果を2010年3月に電通大で開催された音響学会春季研究発表会にて報告した。また、本研究の前段階の研究成果として、複素AR音声分析を用いたWienerフィルタによる音声強調の成果が、INTECH BOOK,「Recent Advances in Signal Processing(ISBN 978-953-307-002-5)」の1チャプターとして出版された。

  • Research Products

    (8 results)

All 2010 2009

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (7 results)

  • [Journal Article] Speech Enhancement based on Iterative Wiener Filter using Complex LPC Speech Analysis2009

    • Author(s)
      Keiichi Funaki
    • Journal Title

      Recent Advances in Signal Processing, INTECH BOOK, ISBN 978-953-307-002-5 http://sciyo.com/books/show/title/recent-advances-in-signal-processing 1

      Pages: 251-266

    • Peer Reviewed
  • [Presentation] ロバスト複素AR音声分析に基づくITU-T G.711.1改良方式の検討2010

    • Author(s)
      舟木慶一
    • Organizer
      日本音響学会春季研究発表会
    • Place of Presentation
      電通大(東京都調布市)
    • Year and Date
      2010-03-10
  • [Presentation] ロバスト時変複素AR音声分析に基づくIETF iLBC互換方式の検討2010

    • Author(s)
      舟木慶一
    • Organizer
      日本音響学会春季研究発表会
    • Place of Presentation
      電通大(東京都調布市)
    • Year and Date
      2010-03-08
  • [Presentation] Evaluation of robust complex AR analysis on MPEG-4 ALS for noisy speech2010

    • Author(s)
      舟木慶一
    • Organizer
      IASTED SPPRA2010
    • Place of Presentation
      Innsbruck(オーストリア)
    • Year and Date
      2010-02-19
  • [Presentation] Evaluation of Complex LPC Analysis on Lossless Compression of Finger Print Image Using MPEG-4 ALS2009

    • Author(s)
      舟木慶一
    • Organizer
      IEICE SISA2009
    • Place of Presentation
      関西大学(大阪)
    • Year and Date
      2009-10-23
  • [Presentation] ロバスト時変複素AR音声分析法とその音声処理への応用2009

    • Author(s)
      舟木慶一
    • Organizer
      日本音響学会秋季研究発表会
    • Place of Presentation
      日本大学工学部(東京都)
    • Year and Date
      2009-09-18
  • [Presentation] 超複素解析信号の特性に関する検討2009

    • Author(s)
      舟木慶一
    • Organizer
      日本音響学会秋季研究発表会
    • Place of Presentation
      日本大学工学部(東京都)
    • Year and Date
      2009-09-17
  • [Presentation] ロバスト複素AR分析に基づくオーディオロスレス符号化(ALS)の評価2009

    • Author(s)
      舟木慶一
    • Organizer
      電子情報通信学会音声研究会
    • Place of Presentation
      北海道大学(札幌市)
    • Year and Date
      2009-06-25

URL: 

Published: 2011-06-16   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi