• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2005 Fiscal Year Annual Research Report

統計的手法を用いた知識情報モデルに基づく知的信号処理手法に関する研究

Research Project

Project/Area Number 17656128
Research InstitutionThe University of Tokushima

Principal Investigator

黒岩 眞吾  徳島大学, 工学部, 助教授 (20333510)

Co-Investigator(Kenkyū-buntansha) 北 研二  徳島大学, 高度情報化基盤センター, 教授 (10243734)
任 福継  徳島大学, 工学部, 教授 (20264947)
柘植 覚  徳島大学, 工学部, 講師 (00325250)
Keywords音声学 / 音声認識 / 音声合成 / 知的信号処理 / 認知科学 / HMM音声合成 / パケットロス / 音声強調
Research Abstract

本研究では,欠落が生じても認識性能が低下しない音声認識手法の研究開発、および音声認識結果に基づき欠落区間の音声信号を音声合成により生成し自然音声に接続・補完する手法の研究開発を行っている。以下に,本年度の研究成果を研究項目ごとに示す。
(1)欠落に影響を受けにくい音声認識手法の研究
音声が欠落した区間の音響確率を等確率とし,言語モデルの確率および欠落前後数秒の音響確率を用いることで、0.2秒程度の音声欠落があった場合でも誤り増加率を1割程度までに抑制できることを確認した。一方で,欠落前のみの情報だけでは誤り率の増加を抑制できないことも明らかとなり,今後の検討の必要がある。
(2)音声認識用高速サーチエンジンの研究
サフィックスアレーを用いた高速サーチエンジンの基本設計を終了した。
(3)音源波形の推定法および話者性の抽出に関する研究
欠落していない区間の音声から音源波形を抽出するとともに、欠落部の前後のピッチから欠落区間のピッチを推定し、声道モデルに対応する音響モデルを励振するための音源波形を生成する手法をインプリメントし実験を行ったが,音質の改善はほとんど観測できなかった。一方、合成音声用の音響モデルをMLLRにより話者適応する実験では,僅かながら音質の改善を観測した。
(4)滑らかな波形の接続
時間軸上での滑らかな波形接続のための手法として、相互相関最大基準による接続法を開発した。これにより,接続部の不連続感を大幅に改善することに成功した。
(5)研究用音声データの収集
話者性の研究の一環として、同一話者が繰り返し同じ単語を発声した音声データを収集した。収集したデータを用い,複数の発声から一つの発声を合成する実験を行ったところ,同一話者の同一単語発声を結合した場合でも違和感が生じてしまうことが明らかとなり,話者性の問題の大きさを改めて確認する結果となった。

  • Research Products

    (6 results)

All 2006

All Journal Article (6 results)

  • [Journal Article] 音声認識・音声合成を用いた音声途切れ補間手法2006

    • Author(s)
      黒岩 眞吾
    • Journal Title

      音響学会誌 62・1

      Pages: 3-9

  • [Journal Article] Speaker Recognition for Wire/Wireless Communication Systems2006

    • Author(s)
      Mohamed Abdel Fattah
    • Journal Title

      International Arab Journal of Information Technology 3・1

      Pages: 28-34

  • [Journal Article] Nonparametric Speaker Recognition Method using Earth Mover's Distance2006

    • Author(s)
      黒岩 眞吾
    • Journal Title

      IEICE Transactions on Information and Systems E89-D・3

      Pages: 1074-1081

  • [Journal Article] Phoneme Based Speaker Modeling to Improve Speaker Recognition.2006

    • Author(s)
      Mohamed Abdel Fattah
    • Journal Title

      Information 9・1

      Pages: 135-147

  • [Journal Article] Acoustic Model Adaptation for Codec Speech based on Learning-by-Doing Concept2006

    • Author(s)
      黒岩 眞吾
    • Journal Title

      Journal of Research on Computing Science 17・1

      Pages: 105-114

  • [Journal Article] Specific Speaker's Japanese Speech Corpus over Long and Short Time Periods2006

    • Author(s)
      柘植 覚
    • Journal Title

      Journal of Research on Computing Science 17・1

      Pages: 115-124

URL: 

Published: 2007-04-02   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi