• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2005 Fiscal Year Annual Research Report

音声・音楽識別技術に関する基礎的研究

Research Project

Project/Area Number 16700189
Research InstitutionChiba Institute of Technology

Principal Investigator

大川 茂樹  千葉工業大学, 情報科学部, 助教授 (40306395)

Keywords音声音楽識別 / 音声認識 / 楽音分析 / 音響特徴量
Research Abstract

本研究は,TVやラジオの放送音声のように,音声や音楽,その他の音が混入した音響データに対して,音声や音楽の時区間を自動的に識別し,その結果をメタデータ(本来のデータに付加的に与えるデータ)として付与することを目的としている。現在に至るまで,依然として音声・音楽識別に対する決定的な手法が見出されていないことを鑑みて,有用な特徴量の検討,識別手法(アルゴリズム)の検討,実データ(放送音源など)に対する検証の3つの論点について明らかにすることを目指す。
研究2年目の本年度は,まず,昨年度に引き続き,基礎実験に用いるためのデータ収集およびラベル付けを行った。音声と音楽およびそれらの細分化カテゴリを識別するのに最も有効な音響特徴量として,スペクトル形状に基づく静的特徴と時間変化を表現できる動的特徴の両方について検討した。特に,楽音に特徴的に現れる音高成分に着目し,音響信号中の支配的な周波数成分を検出・追跡し,歌声や音声と音楽が重畳した揚合にも有用な特徴量を検討・提案した。
次に,音声・音楽識別アルゴリズムとして,混合ガウス分布モデルおよび隠れマルコフモデルなどの統計・確率的モデルの利用について検討した。同時に,モデルのカテゴリを細分化(音楽における楽器やジャンルによるモデルの区別)した実験も行い,いくつかの新しい知見を得た。
研究成果の一部は,音声言語処理技術に関する国際会議および日本音響学会講演論文集などに発表した。

  • Research Products

    (4 results)

All 2006 2005

All Journal Article (4 results)

  • [Journal Article] 時間的特徴を用いた音響信号中の音カテゴリ検出2006

    • Author(s)
      谷口徹, 大川茂樹, 誉田雅彰, 白井克彦
    • Journal Title

      日本音響学会講演論文集 2-4-16

      Pages: 48

  • [Journal Article] Discrimination of speech, musical instruments and singing voices using the temporal patterns of sinusoidal segments in audio signals2005

    • Author(s)
      T.Taniguchi, A.Adachi, S.Okawa, M.Honda, K.Shirai
    • Journal Title

      Proc.Interspeech 2005 1

      Pages: 589-592

  • [Journal Article] Sinusoidal Segmentの時間的特徴を用いた音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出2005

    • Author(s)
      谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦
    • Journal Title

      日本音響学会講演論文集 2-6-5

      Pages: 267-268

  • [Journal Article] Knowledge enhanced VR annotating environment for collaborative design2005

    • Author(s)
      S.Aubry, I.Thouvenin, D.Lenne, S.Okawa
    • Journal Title

      Virtual Concept 2005 16-3

      Pages: 101-104

URL: 

Published: 2007-04-02   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi