• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2000 Fiscal Year Annual Research Report

日本語ディクテーションシステムの環境への適応化アルゴリズムの研究および評価

Research Project

Project/Area Number 10680382
Research InstitutionNara Institute of Science and Technology

Principal Investigator

鹿野 清宏  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00263426)

Keywords日本語ディクテーション / 教師なし話者適応 / 環境適応 / 話し言葉言語モデル / タスク向き言語モデル
Research Abstract

今年度は、話者適応、環境雑音適応、タスク向き話し言葉言語モデルの研究で大いに進展した。以下、簡単に項目ごとに報告する。
(1) 教師なし話者適応アルゴリズムの考案と評価
話者選択と充足統計量に基づく教師なし話者適応アルゴリズムを考案した。JNAS連続音声データベース(306人)を用いて、このアルゴリズムの有効性を20k(2万語)の新聞記事ディクテーションタスクで評価した。発声者が任意の1文を発声するだけで、その発声者に近い話者を数十人選択し、あらかじめ蓄えておいた個々の発声者のHMM充足統計量から十数秒で発声者に適応した音韻モデルが構築できた。従来からの教師あり学習のMLLRと比較して、MLLRの50文発声と同等の単語認識率の改善率が達成できた。
(2) 教師なし環境雑音適応アルゴリズムの考案と評価
上記の教師なし話者適応アルゴリズムを拡張して、教師なし環境雑音適応アルゴリズムを考案した。雑音環境下での話者選択技術と、選択された話者の音声データベースに雑音を重畳してMLLRで適応するアルゴリズムである。もっともよい音韻モデルとされてきた雑音重畳データベースからのE-M学習(1日以上)によるマッチドモデルと同等の単語認識率が、15dBから25dBの20kの新聞記事ディクテーションタスクで達成できた。適応時間は数10秒である。
(3) タスク向き話し言葉言語モデル
Webの掲示板からタスク向き言語モデルを作成した。この言語モデルは、丁寧な話し言葉の言語モデルとして、有効であることが、20kのタスク(グルメ&レシピ、健康相談)での高齢者音声データベースを用いた大語彙連続音声認識実験で確かめられた。さらに、Webの検索エンジンと、言語識別として文字トライグラムを用いたコーパス自動収集システムを構築して、言語モデルの自動作成アルゴリズムを開発した。この言語モデルも丁寧な話し言葉の認識ができることが確かめられた。

  • Research Products

    (14 results)

All Other

All Publications (14 results)

  • [Publications] 廣瀬良文,伊藤克亘,鹿野清宏,中村哲: "日本語ディクテーションシステムにおける被覆率の高い言語モデル"電子情報通信学会論文誌. Vol.J83-D-II,No.11,. 2300-2308 (2000)

  • [Publications] 踊堂憲道,伊藤克亘,鹿野清宏,中村哲: "N-gramモデルのエントロピーに基づくパラメータ削減に関する検討"情報処理学会論文誌. Vol.42,No.2. 327-333 (2001)

  • [Publications] 芳澤伸一,馬場朗,松浪加奈子,米良祐一郎,山田実一,鹿野清宏: "充足統計量と話者距離を用いた音韻モデルの教師なし学習"電子情報通信学会技術研究報告. SP2000-89. 83-88 (2000)

  • [Publications] 馬場朗,芳澤伸一,山田実一,李晃伸,鹿野清宏: "高齢者向け音響モデルによる大語彙連続音声認識の評価"情報処理学会研究報告. SLP-35-3. 13-18 (2001)

  • [Publications] 山田実一,馬場朗,芳澤伸一,米良祐一郎,李晃伸,猿渡洋,鹿野清宏: "環境雑音適応アルゴリズムの大語彙連続音声認識による評価"情報処理学会研究報告. SLP-35-6. 31-36 (2001)

  • [Publications] 西村竜一,長友健太郎,小松久美子,黒田由香、李晃伸,猿渡洋,鹿野清宏: "Webからの音声認識用言語モデル自動生成ツールの開発"情報処理学会研究報告. SLP-35-8. 43-48 (2001)

  • [Publications] 長友健太郎,西村竜一,小松久美子,黒田由香,李晃伸,猿渡洋,鹿野清宏: "相補的バックオフを用いた言語モデルの融合ツールの構築"情報処理学会研究報告. SLP-35-9. 49-54 (2001)

  • [Publications] 芳澤伸一,馬場朗,松浪加奈子、米良祐一郎,山田実一,鹿野清宏: "充足統計量と話者距離を用いた教師なし話者適応学習法"日本音響学会講演論文集. 3-3-13. 119-120 (2001)

  • [Publications] 馬場朗,芳澤伸一,山田実一,李晃伸,鹿野清宏: "大語彙連続音声認識における高齢者向け音響モデルの評価"日本音響学会講演論文集. 3-3-11. 115-116 (2001)

  • [Publications] 山田実一,馬場朗,芳澤伸一,米良祐一郎,李晃伸,猿渡洋,鹿野清宏: "HMM合成とMLLRによる環境適応アルゴリズムの評価"日本音響学会講演論文集. 3-3-12. 117-118 (2001)

  • [Publications] 西村竜一,長友健太郎,小松久美子,黒田由香,李晃伸,猿渡洋,鹿野清宏: "Webからの音声認識用言語モデルの自動作成"情報処理学会全国大会. (2001)

  • [Publications] 長友健太郎,西村竜一,小松久美子,黒田由香,李晃伸,猿渡洋,鹿野清宏: "相補的バックオフを用いた言語モデルの融合アルゴリズム"情報処理学会全国大会. (2001)

  • [Publications] 小松久美子,黒田由香,長友健太郎,西村竜一,李晃伸,鹿野清宏: "高齢者タスクにおける話し言葉言語モデルの構築"情報処理学会全国大会. (2001)

  • [Publications] Shinichi Yoshizawa,AkiraBaba,Kanako Matsunami,Yuichiro Mera,Miichi Yamada,Kiyohiro Shikano: "Unsupervised Speaker Adaptation Based on Sufficient HMM Statistics of Selected Speakers"Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing. (accepted). (2001)

URL: 

Published: 2002-04-03   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi