• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

音声・音楽識別技術に関する基礎的研究

研究課題

研究課題/領域番号 16700189
研究機関千葉工業大学

研究代表者

大川 茂樹  千葉工業大学, 工学部, 助教授 (40306395)

キーワード音声音楽識別 / 音声認識 / 楽音分析 / 音響特徴量
研究概要

本研究は,TVやラジオの放送音声のように,音声や音楽,その他の音が混入した音響データに対して,音声や音楽の時区間を自動的に識別し,その結果をメタデータ(本来のデータに付加的に与えるデータ)として付与することを目的としている。現在に至るまで,依然として音声・音楽識別に対する決定的な手法が見出されていないことを鑑みて,有用な特徴量の検討,識別手法(アルゴリズム)の検討,実データ(放送音源など)に対する検証,の3つの論点について明らかにすることを目指す。
研究最終年度の本年度は,有用な特徴量の検討として,前年度に検討した音響信号中に支配的に現れる周波数成分の追跡手法に加えて,信号の瞬時位相成分の時間変化に着目し,基礎的な音カテゴリ識別実験および短音節・連続単語に対する音声認識実験を通して,その有用性および識別性能を検討した。
さらに,音声・音楽識別のためのアルゴリズムの検討として,混合ガウス分布や隠れマルコフモデルなどを利用した統計確率的モデルについての実験および評価を行うとともに,新たにニューラルネットワークと隠れマルコフモデルをハイブリッドに組み合わせたTRAPsモデルに関する検討を行った。
これらの実験的検討により,音声・音楽識別,音カテゴリ識別,および音声認識に関するいくつかの新しい知見を得た。当初の研究計画で挙げた論点のうち,有用な特徴量の検討,識別手法の検討の2つについて,目標をほぼ達成し得たものと考える。研究成果の一部は,音声言語技術に関する国際会議および日本音響学会講演論文集などに発表した。

  • 研究成果

    (5件)

すべて 2007 2006

すべて 雑誌論文 (5件)

  • [雑誌論文] 長時間瞬時位相分析を用いた話し言葉音声認識2007

    • 著者名/発表者名
      久保陽太郎, 大川茂樹, 榑松明, 白井克彦
    • 雑誌名

      日本音響学会講演論文集 3-10-9

      ページ: 121-122

  • [雑誌論文] 話し言葉に見られる音響的曖昧性の抽出に関する検討2006

    • 著者名/発表者名
      細貝則充, 沖田加奈恵, 會田卓也, 大川茂樹
    • 雑誌名

      日本音響学会講演論文集 1-Q-11

      ページ: 259-260

  • [雑誌論文] An analysis of note deviation manner in piano music2006

    • 著者名/発表者名
      Y.Toda, Y.Nakayama, T.Okura, N.Yasuda, S.Okawa
    • 雑誌名

      Proc. ASA/ASJ Joint Meeting 1aMU3

      ページ: 3005

  • [雑誌論文] An analysis of acoustic deviation manner in spontaneous speech2006

    • 著者名/発表者名
      N.Hosogai, K.Okita, T.Aida, S.Okawa
    • 雑誌名

      Proc. ASA/ASJ Joint Meeting 4pSC14

      ページ: 3293

  • [雑誌論文] Instantaneous Phase Analysis Using Artificial Neural Networks for Automatic Speech Recognition2006

    • 著者名/発表者名
      Y.Kubo, S.Okawa, A.Kurematsu, K.Shirai
    • 雑誌名

      Proc. 2007 RISP International Workshop on Nonlinear Circuits and Signal Processing 1

      ページ: 321-324

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi