• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2001 年度 実績報告書

確率的音声認識における音響確率と言語確率の統合方法

研究課題

研究課題/領域番号 11680386
研究機関名古屋大学

研究代表者

武田 一哉  名古屋大学, 工学研究科, 助教授 (20273295)

キーワード大規模言語コーパス / 形態素解析 / 連続音声認識 / 音響モデル / 言語モデル / エントロピー
研究概要

統合的言語モデルと,音響モデル双方のモデル化精度の向上に取り組んだ。言語モデルについて,単語クラスに基づく言語モデルを作成し,辞書に出現しない未知の単語へその出現確率を付与する方法を検討した。単語クラス言語モデルを用いて確率を平滑化した後,未知語を単語クラスに割り振り均等な出現確率を与える方法により,未知語を含んだ音声の認識率を最大10%程度向上させることができることを確認した。言語モデルの学習に際しては,形態素解析ツール茶筅の品詞体系に準じた単語クラスを採用することが有効であることも確認した。
一方音響モデルについては帯域不使用HMMの選択に基づくモデル化を検討した。雑音の影響が狭帯域に集中する場合,雑音の影響が強い帯域以外では,音声の情報が残っている。そこで,雑音の音声のスペクトルの情報が失われてしまった周波数帯域以外の帯域のスペクトル情報を用いて認識を行う方法を考案した。実際には観測されたスペクトルのどの帯域に雑音の影響が強いかは未知である。そこで本研究では観測スペクトルをいくつかの帯域に分割し,それぞれの帯域のスペクトル情報が失われていると仮定しそれぞれ対応したモデルで認識し,認識結果から何らかの方法でモデル選択を行うことで高い精度を持つモデル化を行うことができる。

  • 研究成果

    (13件)

すべて その他

すべて 文献書誌 (13件)

  • [文献書誌] H.Kamiyanagida, H.Saruwatari, K.Takeda, F.Itakura, K.Shikano: "Direcon of Arrival Estimation Using Nonlinear Microphone Array"IEICE TRANS.TUNDAMENTALS. Vol.E84-A,No.4. 999-1010 (2001)

  • [文献書誌] 河口信夫, 牛窪誠一, 松原茂樹, 岩 博之, 梶田将司, 武田一哉, 板倉文忠: "走行車室内音声対話収録システムの開発"電子情報通信学会論文誌. D-II, Vol.J84-D-II No.6. 909-917 (2001)

  • [文献書誌] 西野隆典, 梶田将司, 武田一哉, 板倉文忠: "水平方向及び仰角方向に関する頭部伝達関数の補間"日本音響学会誌, Acoustical Science and Technology. 57巻11号. 685-692 (2001)

  • [文献書誌] Hideki Banno, Kazuya Takeda, Fumitada Itakura: "The effect of group delay spectrum on timbre"Acoustical Science and Technology. 23, 1. 1-9 (2002)

  • [文献書誌] C.Chandra Sekhar, K.Takeda, F.Ikatura: "Recognition of consonant-vowel utterances using Support Vector Machines"ESANN2001, 9th European Symposium On Artificial Neural Networks. 7-12 (2001)

  • [文献書誌] O.Segawa, K.Takeda, F.Itakura: "Continuous speech recognition without end-point detection"IEEE Signal Processing Society, ICASSP, International Conference on Acoustics, Speech, and Signal Processing. Vol.I of VI. 245-248 (2001)

  • [文献書誌] H.Saruwatari, K.Takeda, F.Itakura, K.Shikano: "Blind source separation combining frequency-domain ICA and beam forming"IEEE Signal Processing Society, ICASSP, International Conference on Acoustics, Speech, and Signal Processing. Vol.V of VI. 2733-2736 (2001)

  • [文献書誌] H.Saruwatari, H.Kamiyanagida, K.Takeda, F.Itakura, K.Shikano: "Direction of arrival estimation based on nonlinear microphone array"IEEE Signal Processing Society, ICASSP, International Conference on Acoustics, Speech, and Signal Processing. Vol.V of VI. 3033-3036 (2001)

  • [文献書誌] Hideki Banno, Kazuya Takeda, Fumitada Itakura: "A Study on Perceptual Distance Measure for Phase Spectrum of Stimuli"IEEE Signal Processing Society, ICASSP, International Conference on Acoustics, Speech, and Signal Processing. Vol.V of VI. 3297-3300 (2001)

  • [文献書誌] C.Chandra Sekhar, K.Takeda, F.Itakura: "Close-Class-Set Discrimination Method for Recognition of Stop_Consonant_Vowel Utterances using Support Vector Machines"ICANN2001, International Conference on Artifical Neural Networks. 399-404 (2001)

  • [文献書誌] Y.Kawamura, K.Takeda, F.Itakura: "Robust speech recognition based on selective use of missing frequency band HMMs"Proc. of 7th European Conference on Speech Communication and technology(Eurospeech'01). vol.2. 1115-1118 (2001)

  • [文献書誌] N.Kawaguchi, N.Matsubara, K.Takeda, F.Itakura, Y.Inagaki: "Multimedia data collection of in-car speech communication"Proc. of 7th European Conference on Speech Communication and technology(Eurospeech'01). vol.3. 2027-2030 (2001)

  • [文献書誌] 春日正男, 船田哲男, 林 伸二, 武田一哉: "音声情報処理"コロナ社. (2001)

URL: 

公開日: 2003-04-03   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi