2004 Fiscal Year Annual Research Report

グラフィカルモデリングを用いた話し言葉音声認識の研究

Research Project

Project/Area Number	15650028
Research Institution	Tokyo Institute of Technology
Principal Investigator	篠田浩一東京工業大学, 大学院・情報理工学研究科, 助教授 (10343097)
Co-Investigator(Kenkyū-buntansha)	古井貞煕東京工業大学, 大学院・情報理工学研究科, 教授 (90293076)
Keywords	音声認識 / 計算音声学 / グラフィカルモデリング / 話し言葉工学 / 隠れマルコフモデル / 話者適応化
Research Abstract	グラフィカルモデリングの手法を用いて、音声の内在構造を抽出することを目的とし研究を進めている。将来的には話し言葉の音声認識性能の向上を目標としている。初年度である昨年度は、話し言葉音声における音声の特徴の把握、グラフィカルモデリングのツールの準備を行った。今年度は、実際にグラフィカルモデリングツールを用いた音声のモデル化を行い、その性能を評価した。話し言葉音声は、読み上げ音声とは異なり、一般に話速が大きく、また、調音結合(発声のなまけ)が大きい。そのため、従来の隠れマルコフモデル(HMM)を用いた音声認識では、認識性能が70%と、読み上げ音声と比べると性能が劣る。我々は、グラフィカルモデル、特にその中でも、時系列データに対応したダイナミックベイジアンネットワークを音声に応用する研究を進めている。これは、従来のHMMに代表される画一的な認識単位をベースとしたモデルより、より自由度の大きいモデルを用いることで、音声の様々な現象に対応することを目的としたものである。本年度は、調音器官の運動を主に表す弁別素性に着目し、グラフィカルモデリングの手法を用いて音素をそれら弁別素性の束として表したモデルを用いて、認識性能をあげることを試みた。従来、音素により一意に固定されていた調音器官の位置を、非同期的に変化させることにより、調音結合を効果的に表現することを狙っている。単語発声を対象とした認識実験で、このモデルを評価したところ、従来のHMMに比べ若干の改善を得た。現在は、計算量・メモリ量などの制限からまだ限られた条件での実験のみ可能であるが、今後、グラフィカルモデリングにおけるグラフ構造最適化アルゴリズム、条件付確率の推定アルゴリズムなどの改良を行うことにより、話し言葉など文章発声に対応させるとともに、より精緻なモデリングを行うことで性能を改善させる計画である。

Research Products
(4 results)

All 2005 2004

All Journal Article (4 results)

[Journal Article] 弁別素性のグラフィカルモデリングによる音声認識2005
- Author(s)
  小林隆二, 篠田浩一, 古井貞煕
- Journal Title
  
  日本音響学会春季研究発表会 I(未定)
[Journal Article] 音声認識のための話者適応化技術2004
- Author(s)
  篠田浩一
- Journal Title
  
  電子情報通信学会論文誌D-II J87-D-II No.2
  
  Pages: 371-386
[Journal Article] Robust acoustic modeling for speech recognition2004
- Author(s)
  Koichi Shinoda
- Journal Title
  
  Technical Report of IEICE SP2004-82
  
  Pages: 7-12
[Journal Article] 音声情報処理技術の最先端:2.統計的手法を用いた音声モデリングの高度化とその音声認識への応用2004
- Author(s)
  篠田浩一, 篠崎隆宏
- Journal Title
  
  情報処理 45
  
  Pages: 1012-1019

2004 Fiscal Year Annual Research Report

グラフィカルモデリングを用いた話し言葉音声認識の研究

Principal Investigator

篠田 浩一 東京工業大学, 大学院・情報理工学研究科, 助教授 (10343097)

Research Products

[Journal Article] 弁別素性のグラフィカルモデリングによる音声認識2005

Author(s)

Journal Title

[Journal Article] 音声認識のための話者適応化技術2004

Author(s)

Journal Title

[Journal Article] Robust acoustic modeling for speech recognition2004

Author(s)

Journal Title

[Journal Article] 音声情報処理技術の最先端:2.統計的手法を用いた音声モデリングの高度化とその音声認識への応用2004

Author(s)

Journal Title

篠田浩一東京工業大学, 大学院・情報理工学研究科, 助教授 (10343097)