• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2001 Fiscal Year Annual Research Report

日本語ディクテーションシステムの環境への適応化アルゴリズムの研究および評価

Research Project

Project/Area Number 10680382
Research InstitutionNARA INSTITUTE OF SCIENCE AND TECHNOLOGY

Principal Investigator

鹿野 清宏  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00263426)

Co-Investigator(Kenkyū-buntansha) 川波 弘道  奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80335489)
李 晃伸  奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80332766)
猿渡 洋  奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (30324974)
Keywords日本語ディクテーション / 教師なし話者適応 / 環境雑音適応 / 話し言葉言語モデル / タスク向き言語モデル / 音声対話システム
Research Abstract

話者適応、環境雑音適応、タスク向き話し言葉言語モデル構築の研究を続け、最終年度として、当初の目的を十分に達成した。以下、簡単に項目ごとにまとめる。
1 教師なし話者適応アルゴリズムの考案と評価
昨年度考案した話者選択と十分統計量に基づく教師なし話者適応アルゴリズムの改良を行い、話者選択基準などについて検討した。この教師なし話者適応アルゴリズムは、発声者が任意の1文を発声するだけで、その発声者に近い話者のHMM十分統計量から発声者に適応した高精度な音韻モデルが構築できるものである。
2 教師なし環境雑音適応アルゴリズムの考案と評価
十分統計量を用いた教師なし話者適応アルゴリズムを、環境雑音適応と同時に実行できるアルゴリズムに拡張した。さらに、スペクトルサブトラクション法の導入により、話者・環境同時適応の性能を向上させた。
3 タスク向き話し言葉言語モデルと音声対話システムの構築
Webの検索エンジンと、言語識別として文字トライグラムを用いたコーパス自動収集システムを構築して、言語モデルの自動作成アルゴリズムを開発した。さらに、受付案内ロボットによる音声認識応答による学内案内システムを構築して、開発してきたアルゴリズムの実環境下における有効性の確認およびデータ収集を開始した。
4 開発アルゴリズムの普及
開発してきた話者適応、環境適応、タスクアルゴリズムを、研究代表者が代表をつとめている情報処理学会の「連続音声認識コンソーシアム」を通して、企業、大学への普及の努力を引き続き行っている。

  • Research Products

    (26 results)

All Other

All Publications (26 results)

  • [Publications] 馬場朗, 芳澤伸一, 山田実一, 李晃伸, 鹿野清宏: "高齢者音響モデルによる大語彙連続音声認識"電子情報通信学会論文誌. D2(採録決定). (2002)

  • [Publications] 芳澤伸一, 馬場朗, 松浪加奈子, 米良祐一郎, 山田実一, 李晃伸, 鹿野清宏: "十分統計量と話者距離を用いた音響モデルの教師なし学習法"電子情報通信学会論文誌. D2(採録決定). (2002)

  • [Publications] 山田実一, 馬場朗, 芳澤伸一, 米良祐一郎, 李晃伸, 猿渡洋, 鹿野清宏: "MLLRを用いた音響モデルの教師なし環境雑音適応アルゴリズム"電子情報通信学会論文誌. D2(採録決定). (2002)

  • [Publications] Shinichi Yoshizawa, Akira Baba, Kanako Matsunami, Yuichiro Mera, Miichi Yamada, Kiyohiro Shikano: "Unsupervised Speaker Adaptation Based on the Sufficient HMM Statistics of Selected Speakers"Proceedings of IEEE International conference on Acoustics, Speech and Signal Processing. SPEECH-P3. 341-344 (2001)

  • [Publications] Akinobu Lee, Tatsuya Kawahara, Kiyohiro Shikano: "Gaussian Mixture Selection Using Context-Independent HMM"Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing. SPEECH-9. 69-72 (2001)

  • [Publications] M.Yamada, A.Baba, S.Yoshizawa, Y.Mera, A.Lee, H.Saruwatari, K.Shikano: "Unsupervised Noisy Environment Adaptation Algorithm Using MLLR and Speaker Selection"Proceedings of 7th European Conference on Speech Communication and Technology. 869-872 (2001)

  • [Publications] S.Yoshizawa, A.Baba, K.Matsunami, Y.Mera, M.Yamada, A.Lee, K.Shikano: "Evaluation on Unsupervised Speaker Adaptation Based on Sufficient HMM Statistics of Selected Speakers"Proceedings of 7th European Conference on Speech Communication and Technology. 1219-1222 (2001)

  • [Publications] A.Baba, S.Yoshizawa, M.Yamada, A.Lee, K.Shikano: "Elderly Acoustic Model for Large Vocabulary Continuous Speech Recognition"Proceedings of 7th European Conference on Speech Communication and Technology. 1657-1660 (2001)

  • [Publications] A.Lee, T.Kawahara, K.Shikano: "Julius ---An Open Source Real-Time Large Vocabulary Recognition Engine"Proceedings of 7th European Conference on Speech Communication and Technology. 1691-1694 (2001)

  • [Publications] R.Nishimura, K.Komatsu, Y.Kuroda, K.Nagatomo, A.Lee, H.Saruwatari, K.Shikano: "Automatic N-gram Language Model Creation from Web Resources"Proceedings of 7th European Conference on Speech Communication and Technology. 2127-2130 (2001)

  • [Publications] 鹿野清宏, 馬場朗, 芳澤伸一, 山田実一, 西村竜一, 小松久美子, 黒田由香, 李晃伸: "高齢者音声の認識"電子情報通信学会福祉情報工学研究会. WIT2001-20. 25-30 (2001)

  • [Publications] 河原達也, 住吉貴志, 李晃伸, 武田一哉, 三村正人, 伊藤彰則, 伊藤克亘, 鹿野清宏: "連続音声認識コンソーシアム2000年度版ソフトウェアの概要と評価"情報処理学会研究報告. 2001-SLP-38-6. 37-42 (2001)

  • [Publications] 西村竜一, 内田賢志, 李晃伸, 猿渡洋, 鹿野清宏: "Juliusを用いた学内案内ロボット用音声対話システムの作成"情報処理学会研究報告. 2001-SLP-39-16. (2001)

  • [Publications] 山出慎吾, 松浪加奈子, 馬場朗, 芳澤伸一, 李晃伸, 猿渡洋, 鹿野清宏: "スペクトルサブトラクションを用いた十分統計量に基づく環境・話者適応"情報処理学会研究報告. 2001-SLP-40-28. 1163-1702 (2002)

  • [Publications] 李晃伸, 米良祐一郎, 鹿野清宏: "Juliusによるマルチパス音韻モデルを用いた対話音声認識"第2回「話し言葉の科学と工学」ワークショップ. (2002)

  • [Publications] 米良祐一郎, 李晃伸, 猿渡洋, 鹿野清宏: "Juliusを用いた自由発話の自動ラベリングにおけるラベル尤度の統計的分析"日本音響学会講演論文集. 2-1-5. 57-58 (2001)

  • [Publications] 内田賢志, 李 晃伸, 猿渡 洋, 鹿野清宏: "音声認識エンジンJuliusによる自然対話音声の認識"日本音響学会講演論文集. 3-1-10. 111-112 (2001)

  • [Publications] 李 晃伸, 河原達也, 鹿野清宏: "記述文法に基づく高性能連続音声認識エンジンJulian"日本音響学会講演論文集. 3-1-10. 111-112 (2001)

  • [Publications] 野間啓介, 李 晃伸, 猿渡 洋, 鹿野清宏: "ささやき声の音声認識におけるMLLRに基づく話者適応の評価"日本音響学会講演論文集. 3-1-16. 123-124 (2001)

  • [Publications] 松浪加奈子, 芳澤伸一, 馬場 朗, 李晃伸, 猿渡 洋, 鹿野清宏: "十分統計量を用いた音韻モデルの教師なし学習における話者選択法の検討"日本音響学会講演論文集. 3-1-18. 127-128 (2001)

  • [Publications] 井出慎吾, 馬場 朗, 松浪加奈子, 芳澤伸一, 李晃伸, 猿渡洋, 鹿野清宏: "十分統計量に基づく教師なし環境話者適応におけるスペクトルサブトラクションの効果"日本音響学会講演論文集. 3-2-4. 125-126 (2002)

  • [Publications] 内田賢志, 西村竜一, 李 晃伸, 猿渡 洋, 鹿野清宏: "学内受付案内タスクにおける音声認識の検討"日本音響学会講演論文集. 1-5-24. 47-48 (2002)

  • [Publications] 李晃伸, 河原達也, 鹿野清宏: "認識エンジンJuliusにおけるマルチパス音韻モデルの実装"日本音響学会講演論文集. 2-5-8. 89-90 (2002)

  • [Publications] 米良祐一郎, 李晃伸, 猿渡洋, 鹿野清宏: "自動ラベリングの音韻尤度に基づく音韻モデルの改善"日本音響学会講演論文集. 2-5-11. 95-96 (2002)

  • [Publications] 西村竜一, 怡土順一, 李晃伸, 松本吉央: "情報科学研究の実環境プラットフォームとしての受付案内ロボットASKA"情報処理学会第64回全国大会. (2002)

  • [Publications] 鹿野清宏, 伊藤克亘, 河原達也, 武田一哉, 山本幹雄: "音声認識システム"オーム社(情報処理学会編集 IT text). 198 (2001)

URL: 

Published: 2003-04-03   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi