• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

2次元メルケプストラムを用いる雑音下の単語音声認識

研究課題

研究課題/領域番号 63550253
研究種目

一般研究(C)

配分区分補助金
研究分野 電子通信系統工学
研究機関名古屋工業大学

研究代表者

北村 正  名古屋工業大学, 工学部, 助教授 (60114865)

研究分担者 早原 悦朗  名古屋工業大学, 工学部, 教授 (80024214)
山田 由之  名古屋工業大学, 工学部, 助手 (50024253)
研究期間 (年度) 1988 – 1989
研究課題ステータス 完了 (1989年度)
配分額 *注記
2,100千円 (直接経費: 2,100千円)
1989年度: 200千円 (直接経費: 200千円)
1988年度: 1,900千円 (直接経費: 1,900千円)
キーワード2次元メルケプストラム / メルケプストラム / スペクトルの動的特徴 / 白色雑音 / 有色雑音 / 雑音下での単語音声認識 / 数字音声 / 雑音下での音声認識 / 人間の聴覚特性 / メル周波数 / スペクトルの時間変化情報
研究概要

本研究では、雑音下での単語音声の認識率の向上を目標として、計算機シミュレ-ションによる白色雑音と名古屋駅で収集した実環境の雑音を用いて、特定話者及び不特定話者の数字音声認識を行った。認識手法は我々が提案した2次元メルケプストラムを用いる認識法である。2次元メルケプストラムは人間の聴覚特性を十分考慮した音声の特徴パラメ-タであり、分析区画内の音声のスペクトルの平均的な特徴とその時間変化情報である動的特徴を持っている。本研究において、得られた研究成果及び知見は以下の通りである。
1.2次元メルケプストラムを用いる音声の分析合成系の構成及び評価:
2次元メルケプストラムを用いる音声の分析合成系を構成法を示し、合成音声の品質から音声合成に必要な2次元メルケプストラムの特徴領域を検討した。その結果、10Hz程度までのスペクトルの時間変化情報が必要であることが明らかとなった。(以上論文発表)
2.雑音のSN比の変動に強い参照パタ-ンの作成法の検討:
本研究で提案した参照パタ-ンは、登録音声の時間波形に認識環境下の雑音波形を時間領域で付加し2次元メルケプストラム分析したものである。この参照パタ-ンを利用することにより、入力音声のSN比の変動に強い参照パタ-ンを得ることができることを明らかにした。(以上論文発表)
3.入力音声のSN比の変動に強い認識距離尺度の検討:
本研究では、2次元メルケプストラムの平均的特徴より動的特徴を重要視した距離尺度を提案し、従来の1次元的なメルケプストラムに比べ本方法が特にSN比の低い低品質の単語音声に有効であることを示した。更に、適当なリフタリング操作により低品質の音声に対する認識率の向上が可能となることを明らかにした。(以上論文発表)

報告書

(3件)
  • 1989 実績報告書   研究成果報告書概要
  • 1988 実績報告書
  • 研究成果

    (23件)

すべて その他

すべて 文献書誌 (23件)

  • [文献書誌] 浅村吉範、北村正: "2次元メルケプストラムによる音声の分析合成系" 電子情報通信学会音声研究会資料. SP88-47. 17-24 (1988)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1989 研究成果報告書概要
  • [文献書誌] T.KITAMURA and E.HAYAHARA: "Word recognition using a two-dimensional mel-cepstrum in noisy environments" J.Acoust.Soc.Am.Suppl.1. Vol.84. PPP6 (1988)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1989 研究成果報告書概要
  • [文献書誌] 浅村吉範、秋野秀之、北村正: "2次元メルケプストラムを用いた単音節の分析及び合成" 電子情報通信学会音声研究会資料. SP88-127. 41-48 (1989)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1989 研究成果報告書概要
  • [文献書誌] 水谷忠司、北村正: "雑音下の数字音声認識における参照パタ-ンと距離尺度の検討" 電子情報通信学会音声研究会資料. SP88-121. 39-45 (1989)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1989 研究成果報告書概要
  • [文献書誌] 北村正、片柳恵一: "2次元メルケプストラムの静的特徴・動的特徴を用いる数字音声認識" 電子情報通信学会論文誌(A). J72-A. 640-647 (1989)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1989 研究成果報告書概要
  • [文献書誌] 北村正、早原悦朗: "2次元メルケプストラムの動的特徴を利用する雑音下での特定話者数字音声認識" 電子情報通信学会論文誌(D). J72-D-II. 1242-1247 (1989)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1989 研究成果報告書概要
  • [文献書誌] Yoshinori Asamura, Tadashi Kitamura: "Speech Analysis-Synthesis System Using A Two-Dimensional Mel-Cepstrum" IEICE Technical Report SP88-47, pp.17-24, 1988.

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1989 研究成果報告書概要
  • [文献書誌] Tadashi Kitamura, Etsuro Hayahara: "Word Recognition Using A Two-Dimensional Mel-Cepstrum under Noisy Environments" J.Acoust.Soc.Am.Suppl.1, Vol.84, PPP6, 1988.

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1989 研究成果報告書概要
  • [文献書誌] Tadashi Mizutani, Tadashi Kitamura: "On Methods Making Reference Patterns and Distance Measures in Digit speech Recognition in Noisy Environments." IEICE Technical Report SP88-121, pp.39-45, 1988.

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1989 研究成果報告書概要
  • [文献書誌] Tadashi Kitamura, Keiichi Katayanagi: "Digit Recognition Using Static and Dynamic Features of A Two-Dimensional Mel-Cepstrum." Trans.IEICE, Vol.J72-A, No.4, pp.640-647, 1989.

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1989 研究成果報告書概要
  • [文献書誌] Tadashi Kitamura, Etsuro Hayahara: "Speaker-Dependent Digit Word Recognition in Noisy Environments Using Dynamic Features of A Two-Dimensional Mel-Cepstrum." Trans.IEICE, Vol.J72-D-II, No.8, pp.1242-1247, 1989.

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1989 研究成果報告書概要
  • [文献書誌] 北村正、水谷忠司: "スペクトル変化を利用する雑音下の数字音声認識" 日本音響学会平成元年度春季研究発表会講演論文集. 平1ー03. 113-114 (1989)

    • 関連する報告書
      1989 実績報告書
  • [文献書誌] 北村正、片柳恵一: "2次元メルケプストラムの静的特徴・動的特徴を用いる数字音声認識" 電子情報通信学会論文誌(A). J72ーA. 640-647 (1989)

    • 関連する報告書
      1989 実績報告書
  • [文献書誌] 北村正,早原悦朗: "2次元メルケプストラムの動的特徴を利用する雑音下での特定話者数字音声認識" 電子情報通信学会論文誌(D). J72ーDーII. 1242-1247 (1989)

    • 関連する報告書
      1989 実績報告書
  • [文献書誌] 嶋崎靖彦、北村正: "雑音下における不特定話者の数字音声認識" 平成元年度電気関係学会東海支部連合大会講演論文集. 平1ー10. 422 (1989)

    • 関連する報告書
      1989 実績報告書
  • [文献書誌] 北村正、水谷忠司: "マルチテンプレ-トを用いる雑音下での数字音声認識" 日本音響学会平成元年度秋季研究発表会講演論文集. 平1ー10. 65-66 (1989)

    • 関連する報告書
      1989 実績報告書
  • [文献書誌] 北村正,嶋崎靖彦: "スペクトルの動的特徴を用いる雑音下での不特定話者数字音声認識" 日本音響学会平成2年度春季研究発表会講演論文集. 平2ー03. 5-6 (1990)

    • 関連する報告書
      1989 実績報告書
  • [文献書誌] 北村正: 日本音響学会昭和63年度秋期研究発表会講演論文集. 昭63ー10. 59-60 (1988)

    • 関連する報告書
      1988 実績報告書
  • [文献書誌] 浅村吉範: 電子情報通信学会音声研究会資料. SP88ー47. 17-24 (1988)

    • 関連する報告書
      1988 実績報告書
  • [文献書誌] 水谷忠司: 電子情報通信学会音声研究会資料. SP88ー121. 39-45 (1989)

    • 関連する報告書
      1988 実績報告書
  • [文献書誌] 浅村吉範: 電子情報通信学会音声研究会資料. SP88ー127. 41-48 (1989)

    • 関連する報告書
      1988 実績報告書
  • [文献書誌] 北村正: 日本音響学会平成元年度度春期研究発表会講演論文集. 平成1ー03. 3-4 (1989)

    • 関連する報告書
      1988 実績報告書
  • [文献書誌] 北村正: 電子情報通信学会1989年春期全国大会. 平成1ー03. A-23 (1989)

    • 関連する報告書
      1988 実績報告書

URL: 

公開日: 1988-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi