2005 Fiscal Year Annual Research Report

汎用音声符号系を用いた音声の統一的符号化と音声処理応用システムの研究

Research Project

Project/Area Number	15300026
Research Institution	University of Tsukuba
Principal Investigator	田中和世筑波大学, 大学院・図書館情報メディア研究科, 教授 (70344207)
Co-Investigator(Kenkyū-buntansha)	伊藤慶明岩手県立大学, ソフトウエア情報学部, 助教授 (90325928) 大川茂樹千葉工業大学, 情報科学部, 助教授 (40306395) 児島宏明独立行政法人産業技術総合研究所, 情報技術研究部門, グループリーダ (80356980)
Keywords	汎用音声符号 / 音声検索 / 音声認識 / 高速マッチング / 音声音響モデル / 多言語音声処理
Research Abstract	本研究では、言語系に依存しない汎用音声符号系とその音響モデルの開発を行ない、この汎用音声符号系に基いて、音声認識や音声検索などの応用システムを開発するという目標を掲げた。特に、すべての音声を一旦、この汎用音声符号系に符号化し、その上に応用システムを構築するという本研究独自の柔軟な処理方式を活かした語彙に依存しない「語彙フリー音声検索システム」の開発に注力した。今年度は最終年度であり、システムの構築と性能評価、および本方式の拡張について検討し、ほぼ当初の目標を達成した。まず、語彙フリー音声検索システムを用いて、提案した汎用音声符号系「Sub-Phonetic Segment(SPS)」が他の音声記述単位である音節や音素(triphoneを含む)、さらには半音素・1/3音素など考え得る音響モデルに比べても性能上優位にあることを検証した。本方式では、検索クエリーを音声入力する方法、キーボード入力する方法のどちらも可能であり、また、検索対象ドキュメントもそれが音声である場合、テキストである場合のいずれにも適用可能である。この語彙フリー音声検索システムの応用として、ニュース放送などのビデオ検索システム、災害放送音声検索システムを試作し、人名や地域名など辞書に未登録の語彙外音声による情報検索が可能であることを実証した。ビデオ検索システムは産業技術総合研究所「明日の技術点」などで公開した。また、システムのロバスト性を向上させる目的で、複数マイクロホン入力に対するディジタル信号処理を用いた雑音除去手法を開発した。本プロジェクトで開発した特徴抽出手法、音声記述単位SPS、時系列高速マッチング手法などは広く応用できる手法であり、カーネル主成分分析と組み合わせた音声ドキュメント分割法の開発、また、楽曲境界検出・検索、類似医薬品名の警告提示、環境音の分析・認識などへ適用し有効性を評価した。

Research Products
(20 results)

All 2006 2005

All Journal Article (20 results)

[Journal Article] 分析区間長を可変としたテキスト分割手法2006
- Author(s)
  内海慶, 藤井敦, 田中和世
- Journal Title
  
  言語処理学会12回年次大会(NLP2006)論文集 1
  
  Pages: 4
[Journal Article] 語彙フリー音声検索における時間精緻化サブワードモデルの検討2006
- Author(s)
  岩田耕平, 伊藤慶明, 小嶋和徳, 石亀昌明, 田中和世, 李時旭
- Journal Title
  
  日本音響学会2006年春季研究発表会論文集 1
  
  Pages: 2
[Journal Article] スポッティング区間の再認識に基づく音声検索性能の向上2006
- Author(s)
  大竹, 岩田, 伊藤, 小嶋, 石亀, 田中, 李
- Journal Title
  
  日本音響学会2006年春季研究発表会論文集 1
  
  Pages: 2
[Journal Article] Instantaneous frequencies of signals obtained by the analytic signal method2006
- Author(s)
  H.Suzuki, F.Ma, H.Izumi, O.Yamazaki, S.Okawa, K.Kido
- Journal Title
  
  Acoustical Science and Technology 27・3
  
  Pages: 8
[Journal Article] Multi-mixture based PDT-SSS Algorithm for Extension of an HMnet Structure2006
- Author(s)
  石洙永, 李時旭, 児島宏明
- Journal Title
  
  日本音響学会2006年春季研究発表会論文集 1
  
  Pages: 2
[Journal Article] 電動車いす搭載用平行マイクアレイ実装方式の検討2006
- Author(s)
  佐宗晃, 児島宏明
- Journal Title
  
  日本音響学会2006年春季研究発表会論文集 1
  
  Pages: 2
[Journal Article] Voice activity detection using YIN, a fundamental frequency estimator2006
- Author(s)
  石洙永, 李時旭, 児島宏明
- Journal Title
  
  日本音響学会2006年春季研究発表会論文集 1
  
  Pages: 2
[Journal Article] An algorithm for similar utterance section extraction for managing spoken documents2005
- Author(s)
  Itoh, Y., Tanaka, K., Lee, S.W.
- Journal Title
  
  Multimedia Systems, ISSN:0942-4962 10・5
  
  Pages: 10
[Journal Article] Evaluation of an HMM-Based Feature-Compensation Method Using the AURORA2J2005
- Author(s)
  A.Sasou, F.Asano, K.Tanaka, S.Nakamura
- Journal Title
  
  Proc. of IEEE & EURASIP International Workshop on Nonlinear Signal and Image Processing 1
  
  Pages: 6
[Journal Article] An Approach for Retrieving Inquiries in TV Broadcasts in a Disaster2005
- Author(s)
  K.Iwata, Y.Itoh, K.Kojima, M.Ishigame, K.Tanaka, S.Lee
- Journal Title
  
  IASTED International Conference on Signal and Image Processing 1
  
  Pages: 6
[Journal Article] 語彙フリー音声検索におけるサブワードの検討および災害放送検索システムへの応用2005
- Author(s)
  岩田, 伊藤, 小嶋, 石亀, 田中, 李
- Journal Title
  
  電子情報通信学会研究技術報告 SP2005-21
  
  Pages: 6
[Journal Article] An AR-HMM based speech analysis method and evaluation of singing-voice recognition2005
- Author(s)
  A.Sasou, M.Goto, S.Hayamizu, K.Tanaka
- Journal Title
  
  IEICE Technical Report SP2005-42
  
  Pages: 6
[Journal Article] HMMに基く特徴補正を実装した有限状態文法音声認識エンジンの開発および評価2005
- Author(s)
  佐宗晃, 浅野太, 田中和世
- Journal Title
  
  日本音響学会2005年秋季研究発表会論文集 1
  
  Pages: 2
[Journal Article] 信号音のAR-HMMに基く複合環境音認識の検討2005
- Author(s)
  長谷川智紀, 佐宗晃, 田中和世
- Journal Title
  
  日本音響学会2005年秋季研究発表会論文集 1
  
  Pages: 2
[Journal Article] 語彙フリー音声検索におけるサブワードと応用システムの検討2005
- Author(s)
  岩田耕平, 伊藤慶明, 小嶋和徳, 石亀昌明, 田中和世, 李時旭
- Journal Title
  
  日本音響学会2005年秋季研究発表会論文集 1
  
  Pages: 2
[Journal Article] Human-machine Interface Using EMG Signals for Robot Hand Control2005
- Author(s)
  M.Yoshikawa, T.Tsujimura, M.Mikawa K.Tanaka
- Journal Title
  
  Proceedings of the Society of Instrument and Control Engineers (SICE) Annual Conference 1
  
  Pages: 6
[Journal Article] Issues of SSML in Japanese2005
- Author(s)
  W.Imatake, M.Akabane, K.Tanaka
- Journal Title
  
  Proc. of the W3C workshop on Internatinalizing the Speech Synthesis Markup Language 1
  
  Pages: 2
[Journal Article] Discrimination of speech, musical instruments and singing voices using the temporal patterns of sinusoidal segments in audio signals2005
- Author(s)
  T.Taniguchi, A.Adachi, S.Okawa, M.Honda, K.Shirai
- Journal Title
  
  Proceedings of Interspeech2005 1
  
  Pages: 4
[Journal Article] Sinusoidal Segmentの時間的特徴を用いた音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出2005
- Author(s)
  谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦
- Journal Title
  
  日本音響学会2006年季研究発表会論文集 1
  
  Pages: 2
[Journal Article] 音素片のカーネル主成分分析を用いたトピックセグメンテーション2005
- Author(s)
  佐土原健, 児島宏明, 李時旭
- Journal Title
  
  人工知能学会 1E2-03
  
  Pages: 2

2005 Fiscal Year Annual Research Report

汎用音声符号系を用いた音声の統一的符号化と音声処理応用システムの研究

Principal Investigator

田中 和世 筑波大学, 大学院・図書館情報メディア研究科, 教授 (70344207)

Research Products

[Journal Article] 分析区間長を可変としたテキスト分割手法2006

Author(s)

Journal Title

[Journal Article] 語彙フリー音声検索における時間精緻化サブワードモデルの検討2006

Author(s)

Journal Title

[Journal Article] スポッティング区間の再認識に基づく音声検索性能の向上2006

Author(s)

Journal Title

[Journal Article] Instantaneous frequencies of signals obtained by the analytic signal method2006

Author(s)

Journal Title

[Journal Article] Multi-mixture based PDT-SSS Algorithm for Extension of an HMnet Structure2006

Author(s)

Journal Title

[Journal Article] 電動車いす搭載用平行マイクアレイ実装方式の検討2006

Author(s)

Journal Title

[Journal Article] Voice activity detection using YIN, a fundamental frequency estimator2006

Author(s)

Journal Title

[Journal Article] An algorithm for similar utterance section extraction for managing spoken documents2005

Author(s)

Journal Title

[Journal Article] Evaluation of an HMM-Based Feature-Compensation Method Using the AURORA2J2005

Author(s)

Journal Title

[Journal Article] An Approach for Retrieving Inquiries in TV Broadcasts in a Disaster2005

Author(s)

Journal Title

[Journal Article] 語彙フリー音声検索におけるサブワードの検討および災害放送検索システムへの応用2005

Author(s)

Journal Title

[Journal Article] An AR-HMM based speech analysis method and evaluation of singing-voice recognition2005

Author(s)

Journal Title

[Journal Article] HMMに基く特徴補正を実装した有限状態文法音声認識エンジンの開発および評価2005

Author(s)

Journal Title

[Journal Article] 信号音のAR-HMMに基く複合環境音認識の検討2005

Author(s)

Journal Title

[Journal Article] 語彙フリー音声検索におけるサブワードと応用システムの検討2005

Author(s)

Journal Title

[Journal Article] Human-machine Interface Using EMG Signals for Robot Hand Control2005

Author(s)

Journal Title

[Journal Article] Issues of SSML in Japanese2005

Author(s)

Journal Title

[Journal Article] Discrimination of speech, musical instruments and singing voices using the temporal patterns of sinusoidal segments in audio signals2005

Author(s)

Journal Title

[Journal Article] Sinusoidal Segmentの時間的特徴を用いた音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出2005

Author(s)

Journal Title

[Journal Article] 音素片のカーネル主成分分析を用いたトピックセグメンテーション2005

Author(s)

Journal Title

田中和世筑波大学, 大学院・図書館情報メディア研究科, 教授 (70344207)