• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2004 Fiscal Year Annual Research Report

環境、話者、タスクへの適応性をもつユーザにやさしい音声認識アルゴリズムの研究

Research Project

Project/Area Number 15300060
Research InstitutionNara Institute of Science and Technology

Principal Investigator

鹿野 清宏  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00263426)

Co-Investigator(Kenkyū-buntansha) 猿渡 洋  奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (30324974)
李 晃伸  奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80332766)
川波 弘道  奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80335489)
Keywords話者・環境適応 / 音声対話システム / ハンズフリー音声認識 / 音声による年齢層識別 / 雑音モデル / 無音声認識・無音声電話
Research Abstract

H15年度の研究を発展させるとともに、実環境での音声情報案内システム「たけまるくん」を運用し、音声データの収集およびデータベース化を進めるとともに、教師なし話者適応の研究、ハンズフリー音声認識の研究を行った。さらに、無音声認識、無音声電話などの静かな音声メディアの創成などを行った。
(1)雑音に頑健な音声認識アルゴリズムとHMM(隠れマルコフモデル)十分統計量に基づく教師なし話者適応アルゴリズムの研究開発を次の事項について進めた。
(i)音声情報案内システム「たけまるくん」により,20万発話以上の音声データの収集と書き起こしを行った.従来データが少なかった子供のデータが収集できた.子供の音声データを用いて,高精度子供音韻モデルの構築と,教師なし話者適応の効果を実証した.
(ii)より広範な話者層として,高齢者と成人音声に対して話者適応アルゴリズムを改良した.
(iii)教師なし話者適応プログラムの高速化プログラムを作成した.数秒で動作するオンライン話者適応プログラムパッケージの作成が可能であることが確認できた.
(iv)音声認識エンジンJuliusの機能・性能強化(信頼度の改善,雑音モデルの導入)を行い、雑音モデルについては、音声情報案内システム「たけまるくん」に実装し、ユーザの利用頻度が明らかに向上した。
(2)マイクロフォンアレーによる音声収録技術として、コンパクトかつ廉価なマイクロフォンアレーアルゴリズムの開発を行っている。空間スペクトル減算アレーSSA(Spatial Subtraction Array)の研究開発を進め、従来法より大幅に高い認識性能を達成した。
(i)空間スペクトル演算アレーSSA(Spatial Subtraction Array)の音声認識性能評価・比較を,従来の遅延和型,Griffith-Jim適応型に対して行い,SSAの優位性を種々の雑音環境において確認した.さらにユーザ方位のずれに対する頑健化,実時間方位推定法の検討も行った.
(ii)DSPによるSSAの実時間処理化に先立ち,通常のPCをベースにして実装検討を行った.想定される規模(4〜8素子アレー)において,実時間処理が可能であることを確認できた.
(3)つぶやき声(NAM : Non-Audible Murmur)は,話し手の近くでも聞こえない声である.このNAMの音声認識(無音声認識)と,電話での伝送(無音声電話)の可能性を実証した.

  • Research Products

    (39 results)

All 2005 2004

All Journal Article (39 results)

  • [Journal Article] 人に優しく環境にも適応する音声インタフェースの研究開発2005

    • Author(s)
      鹿野 清宏
    • Journal Title

      システム制御情報学会誌 Vol.49, No.2

      Pages: 53-57

  • [Journal Article] Barge-in free spoken dialogue interface based on response sound cancellation using sound field control and microphone array2005

    • Author(s)
      Shigeki Miyabe, Hiroshi Saruwatari, Kiyohiro Shikano
    • Journal Title

      Joint Workshop on Hands-Free Speech Communication and Microphone Arrays (printing)

  • [Journal Article] Hands-free speech recognition using spatial subtraction array2005

    • Author(s)
      Yasuaki Ohashi, Koichi Sakamoto, Tsuyoki Nishikawa, Hiroshi Saruwatari, Kiyohiro Shikano
    • Journal Title

      Joint Workshop on Hands-Free Speech Communication and Microphone Arrays (printing)

  • [Journal Article] Speech recognition using barge-in free spoken dialogue interface based on multi-channel sound field control2005

    • Author(s)
      Shigeki Miyabe, Hiroshi Saruwatari, Kiyohiro Shikano
    • Journal Title

      IEICE Technical Report EA2005-117

      Pages: 1-6

  • [Journal Article] 空間的サブトラクションアレーと既知雑音重畳を用いたハンズフリー音声認識2005

    • Author(s)
      大橋靖明, 西川剛樹, 猿渡洋, 鹿野清宏
    • Journal Title

      電子情報通信学会技術研究報告 EA2005-123

      Pages: 37-42

  • [Journal Article] 信頼度基準デコーディングを用いた高効率な単語グラフ生成法2005

    • Author(s)
      李晃伸, 河原達也, 鹿野清宏
    • Journal Title

      情報処理学会研究報告 2005-SLP-55-13

      Pages: 71-76

  • [Journal Article] 子供音声認識における年齢層を考慮した音響モデルおよび適応手法の評価2005

    • Author(s)
      鮫島充, 李晃伸, 猿渡洋, 鹿野清宏
    • Journal Title

      日本音響学会研究発表会講演論文集 1-5-20

      Pages: 39-40

  • [Journal Article] 音声対話システムにおける信頼度基準と音響基準を統合した不要音棄却2005

    • Author(s)
      山田真士, 李晃伸, 猿渡洋, 鹿野清宏
    • Journal Title

      日本音響学会研究発表会講演論文集 2-5-2

      Pages: 57-58

  • [Journal Article] 既知雑音重畳を用いたフレームベース減算型残響抑圧処理の評価2005

    • Author(s)
      松本大典, 馬場朗, 李晃伸, 猿渡洋, 鹿野清宏
    • Journal Title

      日本音響学会研究発表会講演論文集 2-Q-5

      Pages: 107-108

  • [Journal Article] 雑音環境下における頑健なNAM認識のための参照マイクを用いた雑音除去2005

    • Author(s)
      竹苗浩司, 中島淑貴, Panikos Heracleous, 李晃伸, 猿渡洋, 鹿野清宏
    • Journal Title

      日本音響学会研究発表会講演論文集 2-Q-11

      Pages: 119-120

  • [Journal Article] 空間的サブトラクションアレーを用いたハンズフリー音声認識の高精度化2005

    • Author(s)
      大橋靖明, 西川剛樹, 猿渡洋, 李晃伸, 鹿野清宏
    • Journal Title

      日本音響学会研究発表会講演論文集 2-Q-14

      Pages: 125-126

  • [Journal Article] Speaker-class Reduction for HMM Sufficient Statistics Adaptation using Multiple Acoustic Models2005

    • Author(s)
      Randy Gomez, Akinobu Lee, Hiroshi Saruwatari, Kiyohiro Shikano
    • Journal Title

      日本音響学会研究発表会講演論文集 2-Q-18

      Pages: 133-134

  • [Journal Article] 実環境における頑健な音声認識のための音韻モデルの教師なし話者適応2004

    • Author(s)
      山出慎吾, 馬場朗, 芳澤伸一, 李晃伸, 猿渡洋, 鹿野清宏
    • Journal Title

      電子情報通信学会論文誌 Vol.J87-D-II, No.4

      Pages: 933-941

  • [Journal Article] 非可聴つぶやき認識2004

    • Author(s)
      中島淑貴, 柏岡秀紀, ニックキャンベル, 鹿野清宏
    • Journal Title

      電子情報通信学会論文誌 Vol.J87-D-II, No.9

      Pages: 1757-1764

  • [Journal Article] Interface for barge-in free spoken dialogue system using adaptive sound field control and microphone array2004

    • Author(s)
      Tatsunori Asai, Yoichi Hinamoto, Hiroshi Saruwatari, Kiyohiro Shikano
    • Journal Title

      18th International Congress on Acoustics vol.I

      Pages: 755-758

  • [Journal Article] Public speech-oriented guidance system with adult and child discrimination capability2004

    • Author(s)
      Ryuichi Nisimura, Akinobu Lee, Hiroshi Saruwatari, Kiyohiro Shikano
    • Journal Title

      IEEE International Conference on Acoustics, Speech, and Signal Processing vol.I

      Pages: 433-436

  • [Journal Article] Real-time word confidence scoring using local posterior probabilities on tree trellis search2004

    • Author(s)
      Akinobu Lee, Kiyohiro Shikano, Tatsuya Kawahara
    • Journal Title

      IEEE International Conference on Acoustics, Speech, and Signal Processing Vol.I

      Pages: 793-796

  • [Journal Article] Audible (normal) speech and inaudible murmur recognition using NAM microphone2004

    • Author(s)
      Panikos Heracleous, Yoshitaka Nakajima, Akinobu Lee, Hiroshi Saruwatari, Kiyohiro Shikano
    • Journal Title

      European Signal Processing Conference

      Pages: 329-332

  • [Journal Article] Noice robust real world spoken dialogue system using GMM based rejection of unintended inputs2004

    • Author(s)
      Akinobu Lee, Keisuke Nakamura, Ryuichi Nisimura, Hiroshi Saruwatari, Kiyohiro Shikano
    • Journal Title

      International Conference on Spoken Language Processing

      Pages: 173-176

  • [Journal Article] Rapid EM training based on model-integration2004

    • Author(s)
      Shinichi Yoshizawa, Kiyohiro Shikano
    • Journal Title

      International Conference on Spoken Language Processing

      Pages: 649-652

  • [Journal Article] Non-audible murmur (NAM) speech recognition using a stethoscopic NAM microphone2004

    • Author(s)
      Panikos Heracleous, Yoshitaka Nakajima, Akinobu Lee, Hiroshi Saruwatari, Kiyohiro Shikano
    • Journal Title

      International Conference on Spoken Language Processing

      Pages: 1469-1472

  • [Journal Article] Interface for barge-in free spoken dialogue system using adaptive sound field control2004

    • Author(s)
      Tatsunori Asai, Shigeki Miyabe, Hiroshi Saruwatari, Kiyohiro Shikano
    • Journal Title

      International Conference on Spoken Language Processing

      Pages: 2665-2668

  • [Journal Article] Recent progress of open-source LVCSR engine Julius and Japanese model repository2004

    • Author(s)
      Tatsuya Kawahara, Akinobu Lee, Kazuya Takeda, Katsunobu Itou, Kiyohiro Shikano
    • Journal Title

      International Conference on Spoken Language Processing

      Pages: 3069-3072

  • [Journal Article] マルチチャネル音場制御による応答音相殺技術を用いた小規模バージインフリー音声対話インタフェース2004

    • Author(s)
      宮部滋樹, 猿渡洋, 鹿野清宏
    • Journal Title

      電子情報通信学会技術研究報告 EA2004-33

      Pages: 19-24

  • [Journal Article] 空間的サブトラクションアレーを用いた雑音下でのハンズフリー音声認識2004

    • Author(s)
      大橋靖明, 阪本浩一, 猿渡洋, 鹿野清宏
    • Journal Title

      日本音響学会研究発表会講演論文集 1-1-3

      Pages: 5-6

  • [Journal Article] ロボットへの音声入力を目指した遠隔発話の認識2004

    • Author(s)
      松本大典, 馬場朗, 李晃伸, 猿渡洋, 鹿野清宏
    • Journal Title

      日本音響学会研究発表会講演論文集 1-1-5

      Pages: 9-10

  • [Journal Article] 家庭環境におけるスペクトルサブトラクションによる残響抑圧を利用した音声認識2004

    • Author(s)
      馬場朗, 松本大典, 李晃伸, 猿渡洋, 鹿野清宏
    • Journal Title

      日本音響学会研究発表会講演論文集 1-1-9

      Pages: 17-18

  • [Journal Article] 雑音下におけるNon-Audible Murmur(NAM)認識の頑健性の評価2004

    • Author(s)
      竹苗浩司, 中島淑貴, Panikos Heracleous, 李晃伸, 猿渡洋, 鹿野清宏
    • Journal Title

      日本音響学会研究発表会講演論文集 1-1-16

      Pages: 31-32

  • [Journal Article] 子供音声に対する十分統計量に基づく教師なし話者適応の検討2004

    • Author(s)
      鮫島充, 李晃伸, 猿渡洋, 鹿野清宏
    • Journal Title

      日本音響学会研究発表会講演論文集 2-4-12

      Pages: 109-110

  • [Journal Article] 実環境音声情報案内システムのための未知語検出の検討2004

    • Author(s)
      西村竜一, 李 晃伸, 鹿野清宏
    • Journal Title

      日本音響学会研究発表会講演論文集 3-1-8

      Pages: 125-126

  • [Journal Article] A baseline study on speaker-independent Non-Audible Murmur (NAM) speech recognition2004

    • Author(s)
      Panikos Heracleous, Yoshitaka Nakajima, Akinobu Lee, Hiroshi Saruwatari, Kiyohiro Shikano
    • Journal Title

      日本音響学会研究発表会講演論文集 1-P-8

      Pages: 177-178

  • [Journal Article] Effects of multiple acoustic models in unsupervised speaker adaptation based on HMM sufficient statistics2004

    • Author(s)
      Randy Gomez, Akinobu Lee, Hiroshi Saruwatari, Kiyohiro Shikano
    • Journal Title

      日本音響学会研究発表会講演論文集 1-P-9

      Pages: 179-180

  • [Journal Article] 実環境情報案内システムにおける自立語信頼度を用いた発話棄却の検討2004

    • Author(s)
      山田真士, 李晃伸, 猿渡洋, 鹿野清宏
    • Journal Title

      日本音響学会研究発表会講演論文集 1-P-14

      Pages: 189-190

  • [Journal Article] 公共音声情報案内システム『たけまるくん』の改善2004

    • Author(s)
      李 晃伸, 山田真士, 鹿野清宏, 西村竜一
    • Journal Title

      日本音響学会研究発表会講演論文集 1-P-27

      Pages: 215-216

  • [Journal Article] 連続音声認識プログラムJuliusのSHマイコンへの搭載2004

    • Author(s)
      小窪浩明, 畑岡信夫, 庄司厚志, 堀尾公正, 高橋久, 李晃伸, 鹿野清宏, 河原達也
    • Journal Title

      日本音響学会研究発表会講演論文集 1-P-29

      Pages: 219-220

  • [Journal Article] マルチチャネル音場制御を用いた応答音相殺技術に基づく小規模バージインフリー音声対話インタフェース2004

    • Author(s)
      宮部滋樹, 猿渡洋, 鹿野清宏
    • Journal Title

      日本音響学会研究発表会講演論文集 3-Q-16

      Pages: 745-746

  • [Journal Article] 公共音声情報案内システム「たけまるくん」の運用および収集発話の分析2004

    • Author(s)
      李晃伸, 西村竜一, 山田真士, 鹿野清宏
    • Journal Title

      情報処理学会研究報告 2004-SLP-53-9

      Pages: 49-54

  • [Journal Article] 子供音声認識のための音響モデルの構築および適応手法の評価2004

    • Author(s)
      鮫島充, 李晃伸, 猿渡洋, 鹿野清宏
    • Journal Title

      情報処理学会研究報告 2004-SLP-54-34

      Pages: 199-204

  • [Journal Article] Unsupervised speaker adaptation based on HMM sufficient statistics using multiple acoustic models under noisy environment2004

    • Author(s)
      Randy Gomez, Akinobu Lee, Hiroshi Saruwatari, Kiyohiro Shikano
    • Journal Title

      情報処理学会研究報告 2004-SLP-54-35

      Pages: 247-252

URL: 

Published: 2006-07-12   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi