• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2005 年度 実績報告書

汎用音声符号系を用いた音声の統一的符号化と音声処理応用システムの研究

研究課題

研究課題/領域番号 15300026
研究機関筑波大学

研究代表者

田中 和世  筑波大学, 大学院・図書館情報メディア研究科, 教授 (70344207)

研究分担者 伊藤 慶明  岩手県立大学, ソフトウエア情報学部, 助教授 (90325928)
大川 茂樹  千葉工業大学, 情報科学部, 助教授 (40306395)
児島 宏明  独立行政法人産業技術総合研究所, 情報技術研究部門, グループリーダ (80356980)
キーワード汎用音声符号 / 音声検索 / 音声認識 / 高速マッチング / 音声音響モデル / 多言語音声処理
研究概要

本研究では、言語系に依存しない汎用音声符号系とその音響モデルの開発を行ない、この汎用音声符号系に基いて、音声認識や音声検索などの応用システムを開発するという目標を掲げた。特に、すべての音声を一旦、この汎用音声符号系に符号化し、その上に応用システムを構築するという本研究独自の柔軟な処理方式を活かした語彙に依存しない「語彙フリー音声検索システム」の開発に注力した。今年度は最終年度であり、システムの構築と性能評価、および本方式の拡張について検討し、ほぼ当初の目標を達成した。
まず、語彙フリー音声検索システムを用いて、提案した汎用音声符号系「Sub-Phonetic Segment(SPS)」が他の音声記述単位である音節や音素(triphoneを含む)、さらには半音素・1/3音素など考え得る音響モデルに比べても性能上優位にあることを検証した。本方式では、検索クエリーを音声入力する方法、キーボード入力する方法のどちらも可能であり、また、検索対象ドキュメントもそれが音声である場合、テキストである場合のいずれにも適用可能である。
この語彙フリー音声検索システムの応用として、ニュース放送などのビデオ検索システム、災害放送音声検索システムを試作し、人名や地域名など辞書に未登録の語彙外音声による情報検索が可能であることを実証した。ビデオ検索システムは産業技術総合研究所「明日の技術点」などで公開した。
また、システムのロバスト性を向上させる目的で、複数マイクロホン入力に対するディジタル信号処理を用いた雑音除去手法を開発した。
本プロジェクトで開発した特徴抽出手法、音声記述単位SPS、時系列高速マッチング手法などは広く応用できる手法であり、カーネル主成分分析と組み合わせた音声ドキュメント分割法の開発、また、楽曲境界検出・検索、類似医薬品名の警告提示、環境音の分析・認識などへ適用し有効性を評価した。

  • 研究成果

    (20件)

すべて 2006 2005

すべて 雑誌論文 (20件)

  • [雑誌論文] 分析区間長を可変としたテキスト分割手法2006

    • 著者名/発表者名
      内海慶, 藤井敦, 田中和世
    • 雑誌名

      言語処理学会12回年次大会(NLP2006)論文集 1

      ページ: 4

  • [雑誌論文] 語彙フリー音声検索における時間精緻化サブワードモデルの検討2006

    • 著者名/発表者名
      岩田耕平, 伊藤慶明, 小嶋和徳, 石亀昌明, 田中和世, 李時旭
    • 雑誌名

      日本音響学会2006年春季研究発表会論文集 1

      ページ: 2

  • [雑誌論文] スポッティング区間の再認識に基づく音声検索性能の向上2006

    • 著者名/発表者名
      大竹, 岩田, 伊藤, 小嶋, 石亀, 田中, 李
    • 雑誌名

      日本音響学会2006年春季研究発表会論文集 1

      ページ: 2

  • [雑誌論文] Instantaneous frequencies of signals obtained by the analytic signal method2006

    • 著者名/発表者名
      H.Suzuki, F.Ma, H.Izumi, O.Yamazaki, S.Okawa, K.Kido
    • 雑誌名

      Acoustical Science and Technology 27・3

      ページ: 8

  • [雑誌論文] Multi-mixture based PDT-SSS Algorithm for Extension of an HMnet Structure2006

    • 著者名/発表者名
      石洙永, 李時旭, 児島宏明
    • 雑誌名

      日本音響学会2006年春季研究発表会論文集 1

      ページ: 2

  • [雑誌論文] 電動車いす搭載用平行マイクアレイ実装方式の検討2006

    • 著者名/発表者名
      佐宗晃, 児島宏明
    • 雑誌名

      日本音響学会2006年春季研究発表会論文集 1

      ページ: 2

  • [雑誌論文] Voice activity detection using YIN, a fundamental frequency estimator2006

    • 著者名/発表者名
      石洙永, 李時旭, 児島宏明
    • 雑誌名

      日本音響学会2006年春季研究発表会論文集 1

      ページ: 2

  • [雑誌論文] An algorithm for similar utterance section extraction for managing spoken documents2005

    • 著者名/発表者名
      Itoh, Y., Tanaka, K., Lee, S.W.
    • 雑誌名

      Multimedia Systems, ISSN:0942-4962 10・5

      ページ: 10

  • [雑誌論文] Evaluation of an HMM-Based Feature-Compensation Method Using the AURORA2J2005

    • 著者名/発表者名
      A.Sasou, F.Asano, K.Tanaka, S.Nakamura
    • 雑誌名

      Proc. of IEEE & EURASIP International Workshop on Nonlinear Signal and Image Processing 1

      ページ: 6

  • [雑誌論文] An Approach for Retrieving Inquiries in TV Broadcasts in a Disaster2005

    • 著者名/発表者名
      K.Iwata, Y.Itoh, K.Kojima, M.Ishigame, K.Tanaka, S.Lee
    • 雑誌名

      IASTED International Conference on Signal and Image Processing 1

      ページ: 6

  • [雑誌論文] 語彙フリー音声検索におけるサブワードの検討および災害放送検索システムへの応用2005

    • 著者名/発表者名
      岩田, 伊藤, 小嶋, 石亀, 田中, 李
    • 雑誌名

      電子情報通信学会研究技術報告 SP2005-21

      ページ: 6

  • [雑誌論文] An AR-HMM based speech analysis method and evaluation of singing-voice recognition2005

    • 著者名/発表者名
      A.Sasou, M.Goto, S.Hayamizu, K.Tanaka
    • 雑誌名

      IEICE Technical Report SP2005-42

      ページ: 6

  • [雑誌論文] HMMに基く特徴補正を実装した有限状態文法音声認識エンジンの開発および評価2005

    • 著者名/発表者名
      佐宗晃, 浅野太, 田中和世
    • 雑誌名

      日本音響学会2005年秋季研究発表会論文集 1

      ページ: 2

  • [雑誌論文] 信号音のAR-HMMに基く複合環境音認識の検討2005

    • 著者名/発表者名
      長谷川智紀, 佐宗晃, 田中和世
    • 雑誌名

      日本音響学会2005年秋季研究発表会論文集 1

      ページ: 2

  • [雑誌論文] 語彙フリー音声検索におけるサブワードと応用システムの検討2005

    • 著者名/発表者名
      岩田耕平, 伊藤慶明, 小嶋和徳, 石亀昌明, 田中和世, 李時旭
    • 雑誌名

      日本音響学会2005年秋季研究発表会論文集 1

      ページ: 2

  • [雑誌論文] Human-machine Interface Using EMG Signals for Robot Hand Control2005

    • 著者名/発表者名
      M.Yoshikawa, T.Tsujimura, M.Mikawa K.Tanaka
    • 雑誌名

      Proceedings of the Society of Instrument and Control Engineers (SICE) Annual Conference 1

      ページ: 6

  • [雑誌論文] Issues of SSML in Japanese2005

    • 著者名/発表者名
      W.Imatake, M.Akabane, K.Tanaka
    • 雑誌名

      Proc. of the W3C workshop on Internatinalizing the Speech Synthesis Markup Language 1

      ページ: 2

  • [雑誌論文] Discrimination of speech, musical instruments and singing voices using the temporal patterns of sinusoidal segments in audio signals2005

    • 著者名/発表者名
      T.Taniguchi, A.Adachi, S.Okawa, M.Honda, K.Shirai
    • 雑誌名

      Proceedings of Interspeech2005 1

      ページ: 4

  • [雑誌論文] Sinusoidal Segmentの時間的特徴を用いた音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出2005

    • 著者名/発表者名
      谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦
    • 雑誌名

      日本音響学会2006年季研究発表会論文集 1

      ページ: 2

  • [雑誌論文] 音素片のカーネル主成分分析を用いたトピックセグメンテーション2005

    • 著者名/発表者名
      佐土原健, 児島宏明, 李時旭
    • 雑誌名

      人工知能学会 1E2-03

      ページ: 2

URL: 

公開日: 2007-04-02   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi