• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2005 年度 実績報告書

環境、話者、タスクへの適応性をもつユーザにやさしい音声認識アルゴリズムの研究

研究課題

研究課題/領域番号 15300060
研究機関奈良先端科学技術大学院大学

研究代表者

鹿野 清宏  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00263426)

研究分担者 猿渡 洋  奈良先端科学技術大学院大学, 情報科学研究科, 助教授 (30324974)
川波 弘道  奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80335489)
戸田 智基  奈良先端科学技術大学院大学, 情報科学研究科, 助手 (90403328)
キーワード話者・環境適応 / 音声対話システム / ハンズフリー音声認識 / 音声による年齢層識別 / 雑音モデル / 無音声認識・無音声電話
研究概要

H15、16年度の研究を発展させるとともに、実環境での音声情報案内システム「たけまるくん」を運用し、音声データの収集およびデータベース化を進めた。教師なし話者適応の研究、ハンズフリー音声認識の研究を行った。非可聴つぶやき声(NAM : Non-Audible Murmur)による静かな音声メディアによる音声認識の研究も推進した。
(1)雑音に頑健な音声認識アルゴリズムとHMM(隠れマルコフモデル)十分統計量に基づく教師なし話者適応アルゴリズムの研究開発を次の事項について進めた。
(i)音声情報案内システム「たけまるくん」により,2年間分約30万発話の音声データの収集と書き起こしを終了した.このデータベースを利用して、新しい音韻モデルの構築アルゴリズムの研究を開始した。
(ii)HMM十分統計量に基づく教師なし話者適応アルゴリズムの高速化を達成し、数秒で適応できるオンラインシステムを構築した.
(iii)音韻モデルの構築のゴストを減らすことを目指して、膨大な既存の音声データベースからタスクに適した音韻モデルを自動構築するアルゴリズムを考案し、その有効性を実証した.
(iv)学研北生駒駅に音声情報案内システムを設置して運用を3月末に開始する予定である。並行して、ロボット対話システムも設置する予定であり、システム構築を行った。
(2)マイクロフォンアレーによる音声収録技術として、コンパクトかつ廉価なマイクロフォンアレーアルゴリズムの開発を行っている。空間スペクトル減算アレーSSA(Spatial Subtraction Array)の研究開発を進め、従来法より大幅に高い認識性能を達成した。
(i)空間スペクトル演算アレーSSA(Spatial Subtraction Array)の改良、音声認識性能評価・比較を,従来の遅延和型,Griffith-Jim適応型に対して行い,SSAの優位性を確認した.
(ii)PCをベースで、ハンズフリー対話システムを構築して、実時間処理が可能であることを実証した.
(3)つぶやき声(NAM : Non-Audible Murmur)は,話し手の近くでも聞こえない声である.NAMによる音声認識(無音声認識)の研究,および、声を出さない電話(無音声電話)の研究が進んだ.

  • 研究成果

    (42件)

すべて 2006 2005

すべて 雑誌論文 (42件)

  • [雑誌論文] コードブックを用いた実時間処理CMNの実装と評価2006

    • 著者名/発表者名
      追立真吾
    • 雑誌名

      情報処理学会研究報告 2005-SLP-60-2

      ページ: 12-17

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Lombard肉伝導音声に対するマルチ発話様式対応音響モデルの評価2006

    • 著者名/発表者名
      貝野 友美
    • 雑誌名

      日本音響学会講演論文集 1-1-2

      ページ: 3-4

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 音響尤度を用いた書き起こしデータの自動選択2006

    • 著者名/発表者名
      加藤 智之
    • 雑誌名

      日本音響学会講演論文集 1-11-13

      ページ: 47-48

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 発話単位の選択学習によるJNASデータベースからの公共案内システム音響モデルの作成2006

    • 著者名/発表者名
      進藤 泉
    • 雑誌名

      日本音響学会講演論文集 1-11-14

      ページ: 49-50

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Fast Implementation of Maximum Likelihood Linear Regression for Unsupervised Speaker Adaptation using HMM-Sufficient Statistics2006

    • 著者名/発表者名
      Randy Gomez
    • 雑誌名

      日本音響学会講演論文集 1-11-22

      ページ: 65-66

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Improving the Rapid Unsupervised Speaker Adaptation through HMM-Sufficient Statistics Weighting2006

    • 著者名/発表者名
      Randy Gomez
    • 雑誌名

      日本音響学会講演論文集 1-P-6

      ページ: 155-156

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 教師なし選択学習に基づく音響モデル構築の検討2006

    • 著者名/発表者名
      ツィンツァレク トビアス
    • 雑誌名

      日本音響学会講演論文集 1-P-13

      ページ: 169-170

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] コンテキスト依存音響モデルにおける発話単位最尤選択学習法の評価2006

    • 著者名/発表者名
      ツィンツァレク トビアス
    • 雑誌名

      日本音響学会講演論文集 1-P-14

      ページ: 171-172

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] コードブックを用いた実時間処理CMNの実装と評価2006

    • 著者名/発表者名
      追立 真吾
    • 雑誌名

      日本音響学会講演論文集 2-1-10

      ページ: 89-90

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 公共音声対話システムの拡張のためのN-gramとGrammarの併用2006

    • 著者名/発表者名
      北村 任宏
    • 雑誌名

      日本音響学会講演論文集 2-11-10

      ページ: 115-116

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 残響を反映した音響モデルを用いた空間的サブトラクションアレーによるハンズフリー音声認識2006

    • 著者名/発表者名
      木内 千絵
    • 雑誌名

      日本音響学会講演論文集 3-1-18

      ページ: 143-144

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Non-Audible Murmur (NAM) Recognition2006

    • 著者名/発表者名
      Yoshitaka Nakajima
    • 雑誌名

      IEICE Trans. Information and Systems Vol.E89-D, No.1

      ページ: 1-8

  • [雑誌論文] Utterance-based Selective Training for the Automatic Creation of Task-Dependent Acoustic Models2006

    • 著者名/発表者名
      Tobias Cincarek
    • 雑誌名

      IEICE Trans. Information and Systems Vol.E89-D, No.3

      ページ: 962-969

  • [雑誌論文] Improving Rapid Unsupervised Speaker Adaptation based on HMM Sufficient Statis-tics in Noisy Environments using Multi-template Models2006

    • 著者名/発表者名
      Randy Gomez
    • 雑誌名

      IEICE Trans. Information and Systems Vol.E89-D, No.3

      ページ: 998-1005

  • [雑誌論文] Interface, for Barge-in Free Spoken Dialogue System Using Nullspace Based Sound Field Control and Beamforming2006

    • 著者名/発表者名
      Shigeki Miyabe
    • 雑誌名

      IEICE Trans. Fundamentals Vol.E89-A, No.3

      ページ: 716-726

  • [雑誌論文] Noise Robust Speech Recognition Based on Spatial Subtraction Array2005

    • 著者名/発表者名
      Yasuaki Ohashi
    • 雑誌名

      Proceedings of International Workshop on Nonlinear Signal and Image Processing

      ページ: 324-327

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Speech Enhancement Using Nullspace-Based Sound Field Control for Barge-in Free Spoken Dialogue Interface2005

    • 著者名/発表者名
      Shigeki Miyabe
    • 雑誌名

      Proceedings of the 2005 IEEE Workshop on Statistical Signal Processing

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Noise-Robust Hands-free Speech Recognition Based on Spatial Subtraction Array and Known Noise Superimposition2005

    • 著者名/発表者名
      Yasuaki Ohashi
    • 雑誌名

      Proc. of International Conference on Intelligent Robots and Systems

      ページ: 533-537

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Nullspace-Based Sound Field Control for Barge-in-Free Spoken Dialogue Interface2005

    • 著者名/発表者名
      Shigeki Miyabe
    • 雑誌名

      Proceedings of 33th International Congress and Exposition on Noise Control Engineering TueAmP01

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Barge-in Free Spoken Dialogue Interface Using Nullspace-Based Sound Field Control and Beamforming2005

    • 著者名/発表者名
      Shigeki Miyabe
    • 雑誌名

      Proceedings of 13th European Signal Processing Conference

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Rapid Unsupervised Speaker Adaptation Based on Multi-template HMM Sufficient Statistics2005

    • 著者名/発表者名
      Randy Gomez
    • 雑誌名

      Proceedings of Interspeech 2005

      ページ: 293-296

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Remodeling of the Sensor for Non-Audible Murmur (NAM)2005

    • 著者名/発表者名
      Yoshiaki Nakajima
    • 雑誌名

      Proceedings of Interspeech 2005

      ページ: 845-848

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] APPLICATIONS OF NAM MICROPHONES IN SPEECH RECOGNITION FOR PRIVACY IN HUMAN-MACHINE2005

    • 著者名/発表者名
      Panikos Heracleous
    • 雑誌名

      Proceedings of Interspeech 2005

      ページ: 3041-3044

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Tissue conductive unvoiced speech recognition in clean and noisy environments2005

    • 著者名/発表者名
      P.Heracleous
    • 雑誌名

      10th International Conference on Speech and Computer

      ページ: 353-356

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Selective EM Training of Acoustic Models based on Sufficient Statistics of Single Utterances2005

    • 著者名/発表者名
      Tobias Cincarek
    • 雑誌名

      IEEE Automatic Speech Recognition and Understanding Workshop

      ページ: 168-173

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 音声認識の新たな展開を模索して2005

    • 著者名/発表者名
      鹿野清宏
    • 雑誌名

      電子情報通信学会技術報告 SP2005-27

      ページ: 1-6

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 母音区間情報を用いた実時間ケプストラム平均正規化(CMN)の検討2005

    • 著者名/発表者名
      追立真吾
    • 雑誌名

      電子情報通信学会技術報告 SP2005-28

      ページ: 7-12

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] マルチ発話様式を考慮した肉伝導音声認識用音響モデルに関する予備的検討2005

    • 著者名/発表者名
      貝野友美
    • 雑誌名

      電子情報通信学会技術報告 SP2005-30

      ページ: 19-24

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 適応雑音推定処理を備えた空間的サブトラクションアレーを用いた実環境下でのハンズフリー音声認識2005

    • 著者名/発表者名
      木内千絵
    • 雑誌名

      AIチャレンジ研究会 10月

      ページ: 6

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 音声対話システムの運用と尤度に基づく音韻モデルの構築2005

    • 著者名/発表者名
      鹿野清宏
    • 雑誌名

      情報論的学習理論ワークショップ 10月

      ページ: 291-296

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 音響尤度を用いた書き起こしデータ選択による音響モデル構築コストの削減2005

    • 著者名/発表者名
      加藤智之
    • 雑誌名

      情報処理学会研究報告 2005-SLP-59-45

      ページ: 229-234

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 公共音声対話システムにおけるN-gramとGrammarの融合によるタスク拡張2005

    • 著者名/発表者名
      北村任宏
    • 雑誌名

      電子情報通信学会技術報告 2005-SP-107

      ページ: 13-18

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] タスク依存音響モデルのための発話レベルでの選択学習法2005

    • 著者名/発表者名
      ツィンツァレク・トビアス
    • 雑誌名

      電子情報通信学会技術報告 2005-SP-135

      ページ: 145-150

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 音場制御とブラインド音源分離を用いたバージインフリー音声対話インタフェース2005

    • 著者名/発表者名
      宮部滋樹
    • 雑誌名

      日本音響学会講演論文集

      ページ: 701-708

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 公共音声対話システムにおける統計的言語モデルとネットワーク文法の融合の検討2005

    • 著者名/発表者名
      北村任宏
    • 雑誌名

      日本音響学会講演論文集 1-7-7

      ページ: 5-6

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] マルチ発話様式を考慮した肉伝導音声用音響モデルの雑音環境下における評価2005

    • 著者名/発表者名
      貝野友美
    • 雑誌名

      日本音響学会講演論文集 1-7-14

      ページ: 19-20

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 音響モデル構築のための書き起こし削減手法の検討2005

    • 著者名/発表者名
      加藤智之
    • 雑誌名

      日本音響学会講演論文集 2-7-18

      ページ: 93-94

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 母音区間情報を用いたオンライン長時間ケプストラム平均正規化法の検討2005

    • 著者名/発表者名
      追立真吾
    • 雑誌名

      日本音響学会講演論文集 3-7-3

      ページ: 107-108

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Rapid Unsupervised Speaker Adaptation Based on HMM-Sufficient Statistics with Linear Smoothing2005

    • 著者名/発表者名
      Randy Gomez
    • 雑誌名

      日本音響学会講演論文集 3-7-5

      ページ: 111-112

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] Tエンジンに搭載したJuliusの高速化を目的としたGMSの計算量削減に関する検討2005

    • 著者名/発表者名
      小窪 浩明
    • 雑誌名

      日本音響学会講演論文集 1-P-6

      ページ: 163-164

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 独立成分分析を導入した空間的サブトラクションアレーによる雑音抑圧2005

    • 著者名/発表者名
      高橋 祐
    • 雑誌名

      日本音響学会講演論文集 3-5-8

      ページ: 619-620

    • 説明
      「研究成果報告書概要(和文)」より
  • [雑誌論文] 適応雑音推定処理を備えた空間的サブトラクションアレーによるハンズブリー音声認識2005

    • 著者名/発表者名
      木内千絵
    • 雑誌名

      日本音響学会講演論文集 2-7-5

URL: 

公開日: 2007-04-02   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi