• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

状態と出力に相互依存関係を有する確率モデルの構造最適化と頑健性強化に関する研究

Research Project

Project/Area Number 17700208
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field Perception information processing/Intelligent robotics
Research InstitutionWaseda University

Principal Investigator

小川 哲司  早稲田大学, 理工学術院, 助手 (70386598)

Project Period (FY) 2005 – 2006
Project Status Completed (Fiscal Year 2006)
Budget Amount *help
¥2,500,000 (Direct Cost: ¥2,500,000)
Fiscal Year 2006: ¥1,200,000 (Direct Cost: ¥1,200,000)
Fiscal Year 2005: ¥1,300,000 (Direct Cost: ¥1,300,000)
Keywordsパターン認識 / 音声情報処理 / 自然発話音声認識 / 音響モデル / モデル構造最適化
Research Abstract

本年度は,以下の2点について検討を行った.
(1)部分隠れマルコフモデル(PHMM)のモデル構造最適選択
PHMMのモデル構造を音韻毎に最適化する枠組みとして,昨年度は,評価基準として重み付き尤度比最大化基準を,最適化アルゴリズムとして遺伝的アルゴリズムを導入し,講演音声認識において従来法の誤りを削減した.本年度は,下記A)〜C)について詳細な検討を行った.
A)評価関数:重み付き尤度比基準,最尤基準,ベイズ基準など複数の評価基準を導入し認識性能を評価したところ,識別的な基準である尤度比基準が最良の性能を与えることがわかった.
B)最適化アルゴリズム:遺伝的アルゴリズムとタブサーチを用いたときの性能を評価したところ,タブサーチは局所解に陥りやすく,遺伝的アルゴリズムの方が高速に最適解に到達することがわかった.
C)識別クラスの共有:探索の効率化のため音韻のクラスタリングを行ったが,最適化の段階でクラスを共有してしまうと,共有しない場合と同程度の性能を得られないことがわかった.
(2)環境の変動に頑健な特徴量の検討
PHMMのように高精度な確率モデルは,HMMなどの単純なモデルと比較して発話者や環境の変動の影響を受け易い.したがって,音響特徴量から発話者の情報や環境の情報を取り除き,識別に必要な情報である音韻情報のみを抽出する手法(識別情報抽出)について検討を行った.識別情報抽出として,HLDAやそれを拡張したManifold HLDA(MHLDA)を提案し,単語音声認識により評価を行ったところ,HLDAとMHLDAにより抽出されたパラメータを統合することで,環境の変動に対して頑健な性能を与えることがわかった.
この知見を発展させ,HLDAにブースティングを導入した確率モデルの統合手法についても検討を行い,最尤識別に比べ頑健性の高い認識が可能になるという予備的な知見も得た.

Report

(2 results)
  • 2006 Annual Research Report
  • 2005 Annual Research Report
  • Research Products

    (13 results)

All 2007 2006 2005

All Journal Article (13 results)

  • [Journal Article] 重み付きHLDAを用いた相補的識別器の構成2007

    • Author(s)
      加藤健一, 小川哲司, 小林哲則
    • Journal Title

      日本音響学会春季研究発表会講演論文集

      Pages: 39-40

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Genetic Algorithm Based Optimization of Partly-Hidden Markov Model Structure Using Discriminative Criterion2006

    • Author(s)
      Tetsuji Ogawa, Tetsunori Kobayashi
    • Journal Title

      IEICE Trans. on Information and Systems vol.E89-D,no.3

      Pages: 939-945

    • NAID

      110004719367

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Manifold HLDA and Its Application to Robust Speech Recognition2006

    • Author(s)
      Toshiaki Kubo, Tetsuji Ogawa, Tetsunori Kobayashi
    • Journal Title

      Proc. Interspeech2006

      Pages: 1551-1554

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 特徴抽出過程におけるブースティングの適用による相補的な識別器の生成およびその統合2006

    • Author(s)
      加藤健一, 小川哲司, 小林哲則
    • Journal Title

      情報処理学会研究報告 2006-SLP-64(35)

      Pages: 203-208

    • NAID

      10018483719

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Genetic Algorithm Based Optimization of Partly-Hidden Markov Model Structure Using Discriminative Criterion2006

    • Author(s)
      Tetsuji Ogawa, Tetsunori Kobayashi
    • Journal Title

      IEICE Trans.on Information and Systems Vol.E89-D, No.3

    • NAID

      110004719367

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Optimizing the Structure of Partly-Hidden Markov Models Using Weighted Likelihood-Ratio Maximization Criterion2005

    • Author(s)
      Tetsuji Ogawa, Tetsunori Kobayashi
    • Journal Title

      Proc.of Interspeech

      Pages: 3353-3356

    • Related Report
      2005 Annual Research Report
  • [Journal Article] A Method for Solving the Permutation Problem of Frequency-Domain Blind Source Separation Usign Reference Signal2005

    • Author(s)
      Takashi Isa, Toshiyuki Sekiya, Tetsuji Ogawa, Tetsunori Kobayashi
    • Journal Title

      Proc.of Biennial on Digital Signal Processing For In-Veicle and Mobile Systems

      Pages: 15-15

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 識別的基準と遺伝的アルゴリズムに基づく隠れ部分マルコフモデルの構造の最適化2005

    • Author(s)
      小川哲司, 小林哲則
    • Journal Title

      電子情報通信学会技術研究報告 SP2005-26

      Pages: 37-42

    • Related Report
      2005 Annual Research Report
  • [Journal Article] ロボット頭部に設置したマイクロホンによる環境変動に頑健な音源定位2005

    • Author(s)
      久保俊明, 持木南生也, 小川哲司, 小林哲則
    • Journal Title

      人工知能学会研究会資料 SIG-Challenge-0522

      Pages: 89-94

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 参照信号によるパーミュテーション問題解決とSMDPの統合による周波数領域BSSの性能向上2005

    • Author(s)
      伊佐崇, 関矢俊之, 小川哲司, 小林哲則
    • Journal Title

      電子情報通信学会技術研究報告 SP2005-32

      Pages: 31-36

    • Related Report
      2005 Annual Research Report
  • [Journal Article] マイク間のスペクトル強度比を利用した音源定位におけるHLDA利用の効果2005

    • Author(s)
      久保俊明, 持木南生也, 小川哲司, 小林哲則
    • Journal Title

      電子情報通信学会技術研究報告 ST2005-33

      Pages: 37-42

    • Related Report
      2005 Annual Research Report
  • [Journal Article] BSSとスペクトルサブトラクションの多段処理による音源分離2005

    • Author(s)
      伊佐崇, 関矢俊之, 小川哲司, 小林哲則
    • Journal Title

      日本音響学会秋季研究発表会講演論文集

      Pages: 705-706

    • Related Report
      2005 Annual Research Report
  • [Journal Article] ロボット頭部に設置した4系統指向性マイクロホンによる音源定位におけるHLDA利用の効果2005

    • Author(s)
      久保俊明, 持木南生也, 小川哲司, 小林哲則
    • Journal Title

      日本音響学会秋季研究発表会講演論文集

      Pages: 717-718

    • Related Report
      2005 Annual Research Report

URL: 

Published: 2005-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi