• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2011 年度 実績報告書

高精度な話し言葉認識技術の開発

研究課題

研究課題/領域番号 22500144
研究機関山形大学

研究代表者

小坂 哲夫  山形大学, 大学院・理工学研究科, 准教授 (50359569)

キーワード話し言葉音声認識 / 音響モデル / 言語モデル / 教師無し話者適応 / 単語グラフ統合 / 話者インデキシング / 話者ベクトル / クロス適応
研究概要

1. システム統合による性能向上 :
LVCSRで性能向上を図るための一つの手段として,システム統合が挙げられる.複数の性質の異なる認識システムの認識結果を統合する手法であり,CNCやROVERなどの方式が提案されている.本研究では,従来あまり検討されていない,時間情報も利用できる単語グラフ統合を検討した.評価は残響環境下で行い,残響条件の異なる複数の音響モデルの結果を統合したところ,性能の向上が得られることが分った.
2. モデル適応の検討 :
教師なしモデル適応の検討を行った.この適応は音響モデルに対する適応と言語モデルに対する適応の2つが考えられるが,両者を併用する場合の効果的な方法について検討した.単純に2つの適応を繰り返す場合と比較し,クロス適応やクロスバリデーション適応を利用することにより性能向上が図れることが分った.さらに適応回数ごとに言語重みや挿入ペナルティを最適化すると,更に性能向上が得られることが分った.
3. 話者インデキシングの検討 :
話者ベクトルに基づく話者インデキシングの検討を行った.話者インデキシングを行うことにより,話者ごとに発話区間を分離することが可能となり,複数人が発声するタスクにおいて教師無し話者適応の利用が可能となる.本研究では,雑音が混入する場合の検討を行った.基本的には雑音を表現する軸を話者ベクトルに追加することにより雑音の分離を行うが,雑音を分離してからクラスタリングを行うよりも,クラスタリングを行った後に雑音を分離したほうが,より高い性能が得られることが分った.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

当初の計画では,23年度以降の検討事項として,モデル適応とシステム統合による性能向上を挙げている.モデル適応に関しては,検討の結果,当初計画していた信頼度による方法より有望な方法が見つかったため,その検討を行い効果を得ている.またシステム統合も様々な環境で検討を行い,本研究で取り上げている単語グラフ統合が有効であることを示すことができた.以上によりおおむね順調に進展していると判断した.

今後の研究の推進方策

平成24年度は本研究プロジェクト最終年度であり,これまで行ってきた研究を評価し,まとめるフェースとなる.22~23年度で検討した項目としては,音響および言語モデルの高精度化,モデル適応,システム統合,話者インデキシングなどが挙げられる.以上の検討結果をもとに,更なる検討を行う.具体的には当初計画どおり,まずシステム統合のさらなる検討を進める.並行して中間評価を行い有望な手法について更なる検討を進める.最終的には複数のタスクにより,これまで検討してきた手法の最終評価を行う.

  • 研究成果

    (7件)

すべて 2012 2011

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (5件) 図書 (1件)

  • [雑誌論文] Unsupervised Cross-Adaptation Approach for Speech Recognition by Combined Language Model and Acoustic Model Adaptation2011

    • 著者名/発表者名
      Tetsuo Kosaka, Taro Miyamoto, Masaharu Kato
    • 雑誌名

      Proc.of APSIPA ASC 2011

      巻: (CD-ROM)

    • 査読あり
  • [学会発表] 単語グラフ統合を用いた残響下音声認識の検討2012

    • 著者名/発表者名
      倉又俊輔, 加藤正治, 小坂哲夫
    • 学会等名
      日本音響学会講演論文集
    • 発表場所
      神奈川大学
    • 年月日
      2012-03-13
  • [学会発表] 教師なし話者適応における各種パラメータの最適化2012

    • 著者名/発表者名
      今野聡介, 加藤正治, 小坂哲夫
    • 学会等名
      情報処理学会東北支部研究会
    • 発表場所
      山形大学
    • 年月日
      2012-03-09
  • [学会発表] 自動発音評定における母音置換規則の検討2012

    • 著者名/発表者名
      佐藤慶, 加藤正治, 小坂哲夫
    • 学会等名
      情報処理学会東北支部研究会
    • 発表場所
      山形大学
    • 年月日
      2012-03-09
  • [学会発表] 雑音下音声認識におけるヒストグラム同等化法の改良2012

    • 著者名/発表者名
      高橋郁也, 加藤正治, 小坂哲夫
    • 学会等名
      情報処理学会東北支部研究会
    • 発表場所
      山形大学
    • 年月日
      2012-03-09
  • [学会発表] 少量のデータによるヒストグラム同等化法の検討2011

    • 著者名/発表者名
      湊竜一, 加藤正治, 小坂哲夫
    • 学会等名
      日本音響学会講演論文集
    • 発表場所
      島根大学
    • 年月日
      2011-09-20
  • [図書] E-Activity and Intelligent Web Construction, "Improvement of Lecture Speech Recognition by Using Unsupervised Adaptation"(16章)2011

    • 著者名/発表者名
      T.Matsuo, 他編
    • 総ページ数
      189-202
    • 出版者
      IGI Global

URL: 

公開日: 2013-06-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi