2005 Fiscal Year Annual Research Report

状態と出力に相互依存関係を有する確率モデルの構造最適化と頑健性強化に関する研究

Research Project

Project/Area Number	17700208
Research Institution	Waseda University
Principal Investigator	小川哲司早稲田大学, 理工学術院, 助手 (70386598)
Keywords	パターン認識 / 音声情報処理 / 自然発話音声認識 / 音響モデル / モデル構造最適化
Research Abstract	本年度は,下記の2点について検討を行った. 1)PHMMの自然発話音声認識への適用複雑な特徴量の時間変化を音響モデルによって扱うことを目的としてPHMMを提案し,新聞読み上げ音声認識においてその有効性を確認してきた.このとき,PHMMにおける状態と出力間の相互依存構造を全ての音韻クラスで共通とする枠組みを採用し,構造最適化に対する予備的な知見を得てきた.本年度は,この枠組みを自然発話音声認識のタスクの一つである,講演音声認識に適用し評価を行うことにより,構造最適化に対する性能のベースラインを調べた.この結果,PHMMは,読み上げ音声認識のみならず講演音声認識においても,一般的な音響モデルであるHMMに対し良好な性能を与えることがわかった. 2)PHMMにおけるモデル構造の最適化に関する検討 PHMMは出力確率と遷移確率双方に前出力依存性を有した確率モデルであるが,これまでの枠組みでは,構造は全ての音韻クラスで共通なものを用いてきた.そこで本年度は,重みつき尤度比最大化基準に基づき,PHMMにおける状態と出力間の依存構造を,音韻クラス毎に最適に選択することを試みた.重みつき尤度比最大化基準は識別的な評価尺度であるため,この基準によって推定されたモデル構造は,結果として正解クラスと不正解クラスに対して高い識別能力を有する.ここでは,全てのカテゴリに対して取り得るモデル構造の組み合わせの中から,最大の重みつき尤度比を与える構造の組み合わせを最適なモデル構造と定義し探索の最適な近似として遺伝的アルゴリズムを適用した.学会講演音声を対象とした連続音声認識実験によって,提案するモデル構造選択手法の有効性を評価したところ,HMMや,構造を全てのカテゴリで共通としたPHMMの誤りを削減することがわかった.

Research Products
(9 results)

All 2006 2005

All Journal Article (9 results)

[Journal Article] Genetic Algorithm Based Optimization of Partly-Hidden Markov Model Structure Using Discriminative Criterion2006
- Author(s)
  Tetsuji Ogawa, Tetsunori Kobayashi
- Journal Title
  
  IEICE Trans.on Information and Systems Vol.E89-D, No.3
[Journal Article] Optimizing the Structure of Partly-Hidden Markov Models Using Weighted Likelihood-Ratio Maximization Criterion2005
- Author(s)
  Tetsuji Ogawa, Tetsunori Kobayashi
- Journal Title
  
  Proc.of Interspeech
  
  Pages: 3353-3356
[Journal Article] A Method for Solving the Permutation Problem of Frequency-Domain Blind Source Separation Usign Reference Signal2005
- Author(s)
  Takashi Isa, Toshiyuki Sekiya, Tetsuji Ogawa, Tetsunori Kobayashi
- Journal Title
  
  Proc.of Biennial on Digital Signal Processing For In-Veicle and Mobile Systems
  
  Pages: 15
[Journal Article] 識別的基準と遺伝的アルゴリズムに基づく隠れ部分マルコフモデルの構造の最適化2005
- Author(s)
  小川哲司, 小林哲則
- Journal Title
  
  電子情報通信学会技術研究報告 SP2005-26
  
  Pages: 37-42
[Journal Article] ロボット頭部に設置したマイクロホンによる環境変動に頑健な音源定位2005
- Author(s)
  久保俊明, 持木南生也, 小川哲司, 小林哲則
- Journal Title
  
  人工知能学会研究会資料 SIG-Challenge-0522
  
  Pages: 89-94
[Journal Article] 参照信号によるパーミュテーション問題解決とSMDPの統合による周波数領域BSSの性能向上2005
- Author(s)
  伊佐崇, 関矢俊之, 小川哲司, 小林哲則
- Journal Title
  
  電子情報通信学会技術研究報告 SP2005-32
  
  Pages: 31-36
[Journal Article] マイク間のスペクトル強度比を利用した音源定位におけるHLDA利用の効果2005
- Author(s)
  久保俊明, 持木南生也, 小川哲司, 小林哲則
- Journal Title
  
  電子情報通信学会技術研究報告 ST2005-33
  
  Pages: 37-42
[Journal Article] BSSとスペクトルサブトラクションの多段処理による音源分離2005
- Author(s)
  伊佐崇, 関矢俊之, 小川哲司, 小林哲則
- Journal Title
  
  日本音響学会秋季研究発表会講演論文集
  
  Pages: 705-706
[Journal Article] ロボット頭部に設置した4系統指向性マイクロホンによる音源定位におけるHLDA利用の効果2005
- Author(s)
  久保俊明, 持木南生也, 小川哲司, 小林哲則
- Journal Title
  
  日本音響学会秋季研究発表会講演論文集
  
  Pages: 717-718

2005 Fiscal Year Annual Research Report

状態と出力に相互依存関係を有する確率モデルの構造最適化と頑健性強化に関する研究

Principal Investigator

小川 哲司 早稲田大学, 理工学術院, 助手 (70386598)

Research Products

[Journal Article] Genetic Algorithm Based Optimization of Partly-Hidden Markov Model Structure Using Discriminative Criterion2006

Author(s)

Journal Title

[Journal Article] Optimizing the Structure of Partly-Hidden Markov Models Using Weighted Likelihood-Ratio Maximization Criterion2005

Author(s)

Journal Title

[Journal Article] A Method for Solving the Permutation Problem of Frequency-Domain Blind Source Separation Usign Reference Signal2005

Author(s)

Journal Title

[Journal Article] 識別的基準と遺伝的アルゴリズムに基づく隠れ部分マルコフモデルの構造の最適化2005

Author(s)

Journal Title

[Journal Article] ロボット頭部に設置したマイクロホンによる環境変動に頑健な音源定位2005

Author(s)

Journal Title

[Journal Article] 参照信号によるパーミュテーション問題解決とSMDPの統合による周波数領域BSSの性能向上2005

Author(s)

Journal Title

[Journal Article] マイク間のスペクトル強度比を利用した音源定位におけるHLDA利用の効果2005

Author(s)

Journal Title

[Journal Article] BSSとスペクトルサブトラクションの多段処理による音源分離2005

Author(s)

Journal Title

[Journal Article] ロボット頭部に設置した4系統指向性マイクロホンによる音源定位におけるHLDA利用の効果2005

Author(s)

Journal Title

小川哲司早稲田大学, 理工学術院, 助手 (70386598)