• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

音声・音楽識別技術に関する基礎的研究

Research Project

Project/Area Number 16700189
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field Perception information processing/Intelligent robotics
Research InstitutionChiba Institute of Technology

Principal Investigator

大川 茂樹  千葉工業大学, 工学部, 助教授 (40306395)

Project Period (FY) 2004 – 2006
Project Status Completed (Fiscal Year 2006)
Budget Amount *help
¥2,900,000 (Direct Cost: ¥2,900,000)
Fiscal Year 2006: ¥800,000 (Direct Cost: ¥800,000)
Fiscal Year 2005: ¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 2004: ¥1,200,000 (Direct Cost: ¥1,200,000)
Keywords音声音楽識別 / 音声認識 / 楽音分析 / 音響特徴量
Research Abstract

本研究は,TVやラジオの放送音声のように,音声や音楽,その他の音が混入した音響データに対して,音声や音楽の時区間を自動的に識別し,その結果をメタデータ(本来のデータに付加的に与えるデータ)として付与することを目的としている。現在に至るまで,依然として音声・音楽識別に対する決定的な手法が見出されていないことを鑑みて,有用な特徴量の検討,識別手法(アルゴリズム)の検討,実データ(放送音源など)に対する検証,の3つの論点について明らかにすることを目指す。
研究最終年度の本年度は,有用な特徴量の検討として,前年度に検討した音響信号中に支配的に現れる周波数成分の追跡手法に加えて,信号の瞬時位相成分の時間変化に着目し,基礎的な音カテゴリ識別実験および短音節・連続単語に対する音声認識実験を通して,その有用性および識別性能を検討した。
さらに,音声・音楽識別のためのアルゴリズムの検討として,混合ガウス分布や隠れマルコフモデルなどを利用した統計確率的モデルについての実験および評価を行うとともに,新たにニューラルネットワークと隠れマルコフモデルをハイブリッドに組み合わせたTRAPsモデルに関する検討を行った。
これらの実験的検討により,音声・音楽識別,音カテゴリ識別,および音声認識に関するいくつかの新しい知見を得た。当初の研究計画で挙げた論点のうち,有用な特徴量の検討,識別手法の検討の2つについて,目標をほぼ達成し得たものと考える。研究成果の一部は,音声言語技術に関する国際会議および日本音響学会講演論文集などに発表した。

Report

(3 results)
  • 2006 Annual Research Report
  • 2005 Annual Research Report
  • 2004 Annual Research Report
  • Research Products

    (13 results)

All 2007 2006 2005 2004

All Journal Article (13 results)

  • [Journal Article] 長時間瞬時位相分析を用いた話し言葉音声認識2007

    • Author(s)
      久保陽太郎, 大川茂樹, 榑松明, 白井克彦
    • Journal Title

      日本音響学会講演論文集 3-10-9

      Pages: 121-122

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 話し言葉に見られる音響的曖昧性の抽出に関する検討2006

    • Author(s)
      細貝則充, 沖田加奈恵, 會田卓也, 大川茂樹
    • Journal Title

      日本音響学会講演論文集 1-Q-11

      Pages: 259-260

    • Related Report
      2006 Annual Research Report
  • [Journal Article] An analysis of note deviation manner in piano music2006

    • Author(s)
      Y.Toda, Y.Nakayama, T.Okura, N.Yasuda, S.Okawa
    • Journal Title

      Proc. ASA/ASJ Joint Meeting 1aMU3

      Pages: 3005-3005

    • Related Report
      2006 Annual Research Report
  • [Journal Article] An analysis of acoustic deviation manner in spontaneous speech2006

    • Author(s)
      N.Hosogai, K.Okita, T.Aida, S.Okawa
    • Journal Title

      Proc. ASA/ASJ Joint Meeting 4pSC14

      Pages: 3293-3293

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Instantaneous Phase Analysis Using Artificial Neural Networks for Automatic Speech Recognition2006

    • Author(s)
      Y.Kubo, S.Okawa, A.Kurematsu, K.Shirai
    • Journal Title

      Proc. 2007 RISP International Workshop on Nonlinear Circuits and Signal Processing 1

      Pages: 321-324

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 時間的特徴を用いた音響信号中の音カテゴリ検出2006

    • Author(s)
      谷口徹, 大川茂樹, 誉田雅彰, 白井克彦
    • Journal Title

      日本音響学会講演論文集 2-4-16

      Pages: 48-48

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Discrimination of speech, musical instruments and singing voices using the temporal patterns of sinusoidal segments in audio signals2005

    • Author(s)
      T.Taniguchi, A.Adachi, S.Okawa, M.Honda, K.Shirai
    • Journal Title

      Proc.Interspeech 2005 1

      Pages: 589-592

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Sinusoidal Segmentの時間的特徴を用いた音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出2005

    • Author(s)
      谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦
    • Journal Title

      日本音響学会講演論文集 2-6-5

      Pages: 267-268

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Knowledge enhanced VR annotating environment for collaborative design2005

    • Author(s)
      S.Aubry, I.Thouvenin, D.Lenne, S.Okawa
    • Journal Title

      Virtual Concept 2005 16-3

      Pages: 101-104

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 音声・楽器音・歌声が重畳した音響信号申のカテゴリ識別2005

    • Author(s)
      谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦
    • Journal Title

      電子情報通信学会技術研究報告 SP2004-153

      Pages: 49-54

    • Related Report
      2004 Annual Research Report
  • [Journal Article] 生活環境音を記録し音響的特徴を用いて要約するインタフェースの提案2005

    • Author(s)
      大塚昭徳, 伊丹徳重, 坂倉美保, 冨塚清史, 大川茂樹
    • Journal Title

      情報処理学会全国大会講演論文集 2

      Pages: 374-375

    • NAID

      170000170314

    • Related Report
      2004 Annual Research Report
  • [Journal Article] 音声・楽器音・歌声が混在した音響信号中のカテゴリ検出2005

    • Author(s)
      谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦
    • Journal Title

      日本音響学会講演論文集 3-P-13

      Pages: 265-266

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Discrimination of speech, musical instruments and singing voices using the temporal patterns of sinusoidal segments in audio signals2004

    • Author(s)
      T.Taniguchi, A.Adachi, S.Okawa, M.Honda, K.Shirai
    • Journal Title

      Proc.International Conference on Speech and Language Technology 3-B-4(CD-ROM)

    • Related Report
      2004 Annual Research Report

URL: 

Published: 2004-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi