メルケプストラム音響処理と多レベル知識処理による音声の認識合成システムの研究

研究課題

研究課題/領域番号	61460131
研究種目	一般研究(B)
配分区分	補助金
研究分野	電子通信系統工学
研究機関	東京工業大学
研究代表者	今井聖東京工業大学, 精密工学研究所, 教授 (50016763)
研究分担者	古市千枝子東京工業大学, 精密工学研究所, 助手 (90016783)
研究期間 (年度)	1986 – 1987
研究課題ステータス	完了 (1987年度)
配分額 *注記	6,600千円 (直接経費: 6,600千円) 1987年度: 800千円 (直接経費: 800千円) 1986年度: 5,800千円 (直接経費: 5,800千円)
キーワード	音声認識 / 音声合成 / 音声セグメンテーション / メルケプストラム / 音響処理 / 知識処理 / 対数スペクトル不偏推定量 / 改良ケプストラム法 / 距離尺度音声残差 / パターンマッチング / 認識合成システム / 音声認識 / 合成 / セグメンテーション / トップダウン / リンク構造
研究概要	本研究により, 音声による人間と機械との間のコミュニケーションの方法を確立する上で, メルケプストラム音響処理と多レベル知識処理による音声の認識合成システムが極めて有用なものであることが確かめられた. 本研究の準備段階で音声の音響, 音韻処理に対する見直しを行い, 高度な処理に利用し得る精密なスペクトル推定法として対数スペクトルの不偏推定法を考案した. 認識系を規則合成系を統合したシステムを構成するうえで実現が最も難しくしかも重要な部分は連続音声のセグメンテーションを行うサブシステムであるが, 本研究では, ラジオのニュース放送のように発声速度が速く, しかも長く連続した音声を約96.4%の確度でセグメンテーションとラベリングを行うことができる高性能のセグメンテーションシステムを実現した. このようなシステムを得ることが可能になったのは, 対数スペクトルの不偏推定法によって精密でしかも安定なスペクトル包絡を抽出できるようになったこと, セグメンテーションパラメータを得るための処理に特殊な擬似微分フィルタを利用したこと, それらによってセグメンテーションの知識処理が容易になったことなどに因る. 音声認識の処理において, 特徴パラメータおよび距離尺度の選択は重要な問題であるが, これに対して検討を加えた結果, 対数スペクトルの不偏推定法あるいは改良ケプストラム法によって抽出したメルケプストラムを用いて, 単純にユークリッド距離によるパターンマッチングによって, 高い認識率が得られることを明らかにした. 音声の規則合成システムの基本的な構成法が得られ, 一応実用になる品質の音声を合成できるシステムを実現したので, 更に音声の明瞭度と音質を向上させるための音源信号生成法の改良を行い, 破裂音と有声摩擦音の音質改善に対し良い結果を得た. 認識合成システム全体の評価は現在行っており, 近く成果を発表する.

報告書

(2件)

1987 研究成果報告書概要
1986 実績報告書

研究成果
(22件)

すべてその他

すべて文献書誌 (22件)

[文献書誌] 今井聖: 電子情報通信学会論文誌. J70-A. 471-480 (1987)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] IMAI, Satoshi: Proc. EUSIPCO-88. Sept. 4. (1988)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] 秋田昌憲: 電子通信学会論文誌. J69-A. 1464-1466 (1986)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] 今井聖: 電子情報通信学会論文誌.
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] 小林隆夫: 電子通信学会論文誌. J69-A. 1431-1438 (1986)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] 古市千枝子: 電子情報通信学会論文誌.
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] IMAI,Satoshi and FURUICHI,Chieko: "Unbiased Qestimation of log Spectrum." Trans,IEICE. J70-A. 471-480 (1987)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] TOKUDA,Keiichi KOBAYASHI,Takao and IMAI,Satoshi: "Cepstral Analysis with non-Uniform Spectral weighting for Spectral Envelope Extraction." Trans. IEICE. J70-A. 652-959 (1987)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] IMAI,Satoshi and FURUICHI,Chieko: "Unbiased Estimator of log Spectrum and its Application to Speech Signal Processing." Proc. EUSIPCO-88. (1988)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] AKITA,Masanori and IMAI,Satoshi: "Comparison of Weighting Functions for the Segmaentation of Sequences of Vowels" Trans.IECE. J69-A. 1464-1466 (1986)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] IMAI,Satoshi and FURUICHI,Chieko: "Segmentation of Continuous Speech into Phonemic Units." Trans. IEICE. (J71-A). ((1988))
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] KOBAYASHI,Takao and IMAI,Satoshi: "Generalized Cepstral Distance Measures" Trans.IEICE. J69-A. 1431-1438 (1986)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] KOBAYASHI,Takao KONDO,Shunichi and IMAI,Satoshi: "Evaluation of Generalized Cepstral Distance Measures for Isolated Word Recognition." Trans. IEICE. J71-A. (8) (1988)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] TOKUDA,Keiich, KObAYAShi,TAKaO and IMAI,Satoshi: "Recursion Formura for Calculation of Mel Gemeralized Cepstrum Coefficients." Trans. IEICE. J71-A. 128-131 (1988)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] FURUICHI,Chieko and IMAI,Satoshi: "Excitation Signal Generation for Rule-Synthesis of High-Quality Speech." Trans. IECICE. (J71-A). (8) ((1988))
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] Lee,Yanghee KOBAYASHI,Takao FURUICHI,Chieko and IMAI,Satoshi: "A conversion Rule for Phonetic Alternants in Korean Speech Synthesis-by-Rule." Trans. IECICE. J71-A. (9) (1988)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1987 研究成果報告書概要
[文献書誌] 秋田昌憲: 電子通信学会論文誌. J69-D. 1450-1458 (1986)
- 関連する報告書
  1986 実績報告書
[文献書誌] 秋田昌憲: 電子通信学会論文誌. J69-A. 1464-1466 (1986)
- 関連する報告書
  1986 実績報告書
[文献書誌] 小林隆夫: 電子通信学会論文誌. J69-7. 1431-1438 (1986)
- 関連する報告書
  1986 実績報告書
[文献書誌] 謝景棠: 電子通信学会技術報告. SP-86-85. 41-47 (1987)
- 関連する報告書
  1986 実績報告書
[文献書誌] 今井聖: 電子通信学会論文誌. J70-A. 10 (1987)
- 関連する報告書
  1986 実績報告書
[文献書誌] 古市千枝子: 電子通信学会論文誌. 9
- 関連する報告書
  1986 実績報告書

メルケプストラム音響処理と多レベル知識処理による音声の認識合成システムの研究

研究代表者

今井 聖 東京工業大学, 精密工学研究所, 教授 (50016763)

6,600千円 (直接経費: 6,600千円)

報告書

研究成果

[文献書誌] 今井聖: 電子情報通信学会論文誌. J70-A. 471-480 (1987)

説明

関連する報告書

[文献書誌] IMAI, Satoshi: Proc. EUSIPCO-88. Sept. 4. (1988)

説明

関連する報告書

[文献書誌] 秋田昌憲: 電子通信学会論文誌. J69-A. 1464-1466 (1986)

説明

関連する報告書

[文献書誌] 今井聖: 電子情報通信学会論文誌.

説明

関連する報告書

[文献書誌] 小林隆夫: 電子通信学会論文誌. J69-A. 1431-1438 (1986)

説明

関連する報告書

[文献書誌] 古市千枝子: 電子情報通信学会論文誌.

説明

関連する報告書

[文献書誌] IMAI,Satoshi and FURUICHI,Chieko: "Unbiased Qestimation of log Spectrum." Trans,IEICE. J70-A. 471-480 (1987)

説明

関連する報告書

[文献書誌] TOKUDA,Keiichi KOBAYASHI,Takao and IMAI,Satoshi: "Cepstral Analysis with non-Uniform Spectral weighting for Spectral Envelope Extraction." Trans. IEICE. J70-A. 652-959 (1987)

説明

関連する報告書

[文献書誌] IMAI,Satoshi and FURUICHI,Chieko: "Unbiased Estimator of log Spectrum and its Application to Speech Signal Processing." Proc. EUSIPCO-88. (1988)

説明

関連する報告書

[文献書誌] AKITA,Masanori and IMAI,Satoshi: "Comparison of Weighting Functions for the Segmaentation of Sequences of Vowels" Trans.IECE. J69-A. 1464-1466 (1986)

説明

関連する報告書

[文献書誌] IMAI,Satoshi and FURUICHI,Chieko: "Segmentation of Continuous Speech into Phonemic Units." Trans. IEICE. (J71-A). ((1988))

説明

関連する報告書

[文献書誌] KOBAYASHI,Takao and IMAI,Satoshi: "Generalized Cepstral Distance Measures" Trans.IEICE. J69-A. 1431-1438 (1986)

説明

関連する報告書

[文献書誌] KOBAYASHI,Takao KONDO,Shunichi and IMAI,Satoshi: "Evaluation of Generalized Cepstral Distance Measures for Isolated Word Recognition." Trans. IEICE. J71-A. (8) (1988)

説明

関連する報告書

[文献書誌] TOKUDA,Keiich, KObAYAShi,TAKaO and IMAI,Satoshi: "Recursion Formura for Calculation of Mel Gemeralized Cepstrum Coefficients." Trans. IEICE. J71-A. 128-131 (1988)

説明

関連する報告書

[文献書誌] FURUICHI,Chieko and IMAI,Satoshi: "Excitation Signal Generation for Rule-Synthesis of High-Quality Speech." Trans. IECICE. (J71-A). (8) ((1988))

説明

関連する報告書

[文献書誌] Lee,Yanghee KOBAYASHI,Takao FURUICHI,Chieko and IMAI,Satoshi: "A conversion Rule for Phonetic Alternants in Korean Speech Synthesis-by-Rule." Trans. IECICE. J71-A. (9) (1988)

説明

関連する報告書

[文献書誌] 秋田昌憲: 電子通信学会論文誌. J69-D. 1450-1458 (1986)

関連する報告書

[文献書誌] 秋田昌憲: 電子通信学会論文誌. J69-A. 1464-1466 (1986)

関連する報告書

[文献書誌] 小林隆夫: 電子通信学会論文誌. J69-7. 1431-1438 (1986)

関連する報告書

[文献書誌] 謝景棠: 電子通信学会技術報告. SP-86-85. 41-47 (1987)

関連する報告書

[文献書誌] 今井聖: 電子通信学会論文誌. J70-A. 10 (1987)

関連する報告書

[文献書誌] 古市千枝子: 電子通信学会論文誌. 9

関連する報告書

今井聖東京工業大学, 精密工学研究所, 教授 (50016763)