2012 年度実績報告書

高精度な話し言葉認識技術の開発

研究課題

研究課題/領域番号	22500144
研究機関	山形大学
研究代表者	小坂哲夫山形大学, 理工学研究科, 教授 (50359569)
研究期間 (年度)	2010-04-01 – 2013-03-31
キーワード	話し言葉音声認識 / 音響モデル / 言語モデル / 教師無し話者適応 / 単語グラフ統合 / クロスバリデーション
研究概要	1. 音響モデルの高精度化による性能向上：　話し言葉を対象とする大語彙連続音声認識(LVCSR)システムの高性能化において特に効果があると考えられる，音響モデルの精度向上の検討を行った．具体的には話者性への対処のため話者クラスモデルについて検討を行った．従来話者クラスタリングを行う場合，１話者が複数のクラスに所属することを認めない方法で検討を行っていたが，この方法ではクラス数を増加した場合，１クラスに用いることのできる学習データ量が減少し，逆に性能が劣化するという問題があった．この問題に対処するために複数クラスへの所属を認め話者クラスモデルを作成したところ，LVCSRにおいて非常に効果が高いことが分かった． 2.システム統合による性能向上：　LVCSRで性能向上を図るための一つの手段として，システム統合が挙げられる．複数の性質の異なる認識システムの認識結果を統合する手法であり，CNCやROVERなどの方式が提案されている．本研究では，従来あまり検討されていない，時間情報も利用できる単語グラフ統合を検討した．上記話者クラスモデルを複数使用し単語グラフ統合を行うことにより性能が向上する可能性を見出すことができた． 3.モデル適応の検討：　教師なしモデル適応の検討を行った．この適応は音響モデルに対する適応と言語モデルに対する適応の2つが考えられるが，今年度は特に言語モデルに対する適応について検討を行った．音響モデル適応で用いられているクロスバリデーション適応を言語モデル適応に利用することにより性能向上が図れることが分った．この場合繰り返し適応が有効であり，かつ適応回数ごとに言語重みや挿入ペナルティを最適化すると，更に性能向上が得られることが分った．また雑音下音声認識に関し，ヒストグラム同等化法の改良を行い認識性能が向上することを確認した．
現在までの達成度 (区分)	理由 24年度が最終年度であるため、記入しない。
今後の研究の推進方策	24年度が最終年度であるため、記入しない。

研究成果
(9件)

すべて 2013 2012 その他

すべて雑誌論文 (3件) (うち査読あり 3件) 学会発表 (5件) 備考 (1件)

[雑誌論文] 識別学習を用いた離散混合分布HMMによる音声認識2013
- 著者名/発表者名
  小坂哲夫，加藤正治
- 雑誌名
  
  情報処理学会論文誌
  
  巻: 54 ページ: 436-442
- 査読あり
[雑誌論文] An investigation of vowel substitution rules in the automatic evaluation system of English pronunciation2013
- 著者名/発表者名
  Kei Sato, Masaharu Kato and Tetsuo Kosaka
- 雑誌名
  
  Proc. of International Congress on Acoustics 2013
  
  巻: 1 ページ: 1-5
- 査読あり
[雑誌論文] A time-synchronous histogram equalization for noise robust speech recognition2013
- 著者名/発表者名
  Fumiya Takahashi, Masaharu Kato and Tetsuo Kosaka
- 雑誌名
  
  Proc. of International Congress on Acoustics 2013
  
  巻: 1 ページ: 1-5
- 査読あり
[学会発表] 話者クラス音響モデルを用いた講演音声認識におけるクラスタリング手法の各種検討2012
- 著者名/発表者名
  今野和樹,大山拓也,加藤正治,小坂哲夫
- 学会等名
  音声言語情報処理研究報告
- 発表場所
  東京工業大学
- 年月日
  2012-12-21
[学会発表] 日本人英語の自動発音評定における誤り規則の検討2012
- 著者名/発表者名
  佐藤慶,加藤正治,小坂哲夫
- 学会等名
  日本音響学会講演論文集
- 発表場所
  信州大学
- 年月日
  2012-09-21
[学会発表] 雑音下音声認識におけるフレーム重みづけヒストグラム同等化法の検討2012
- 著者名/発表者名
  高橋郁也,加藤正治,小坂哲夫
- 学会等名
  日本音響学会講演論文集
- 発表場所
  信州大学
- 年月日
  2012-09-19
[学会発表] 入力音声の韻律情報を用いたHMM音声合成
- 著者名/発表者名
  栗原大樹, 加藤正治, 小坂哲夫
- 学会等名
  情報処理学会東北支部研究会
- 発表場所
  山形大学工学部
[学会発表] クロスバリデーションによる教師なし言語適応における各種パラメータの最適化
- 著者名/発表者名
  高木瑛, 加藤正治, 小坂哲夫
- 学会等名
  情報処理学会東北支部研究会
- 発表場所
  山形大学工学部
[備考] 小坂研究室
- URL
  http://eieweb.yz.yamagata-u.ac.jp/~kosaka/

2012 年度 実績報告書

高精度な話し言葉認識技術の開発

研究代表者

小坂 哲夫 山形大学, 理工学研究科, 教授 (50359569)

理由

研究成果

[雑誌論文] 識別学習を用いた離散混合分布HMMによる音声認識2013

著者名/発表者名

雑誌名

[雑誌論文] An investigation of vowel substitution rules in the automatic evaluation system of English pronunciation2013

著者名/発表者名

雑誌名

[雑誌論文] A time-synchronous histogram equalization for noise robust speech recognition2013

著者名/発表者名

雑誌名

[学会発表] 話者クラス音響モデルを用いた講演音声認識におけるクラスタリング手法の各種検討2012

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 日本人英語の自動発音評定における誤り規則の検討2012

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 雑音下音声認識におけるフレーム重みづけヒストグラム同等化法の検討2012

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 入力音声の韻律情報を用いたHMM音声合成

著者名/発表者名

学会等名

発表場所

[学会発表] クロスバリデーションによる教師なし言語適応における各種パラメータの最適化

著者名/発表者名

学会等名

発表場所

[備考] 小坂研究室

URL

2012 年度実績報告書

小坂哲夫山形大学, 理工学研究科, 教授 (50359569)