• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2005 年度 実績報告書

音声・音楽識別技術に関する基礎的研究

研究課題

研究課題/領域番号 16700189
研究機関千葉工業大学

研究代表者

大川 茂樹  千葉工業大学, 情報科学部, 助教授 (40306395)

キーワード音声音楽識別 / 音声認識 / 楽音分析 / 音響特徴量
研究概要

本研究は,TVやラジオの放送音声のように,音声や音楽,その他の音が混入した音響データに対して,音声や音楽の時区間を自動的に識別し,その結果をメタデータ(本来のデータに付加的に与えるデータ)として付与することを目的としている。現在に至るまで,依然として音声・音楽識別に対する決定的な手法が見出されていないことを鑑みて,有用な特徴量の検討,識別手法(アルゴリズム)の検討,実データ(放送音源など)に対する検証の3つの論点について明らかにすることを目指す。
研究2年目の本年度は,まず,昨年度に引き続き,基礎実験に用いるためのデータ収集およびラベル付けを行った。音声と音楽およびそれらの細分化カテゴリを識別するのに最も有効な音響特徴量として,スペクトル形状に基づく静的特徴と時間変化を表現できる動的特徴の両方について検討した。特に,楽音に特徴的に現れる音高成分に着目し,音響信号中の支配的な周波数成分を検出・追跡し,歌声や音声と音楽が重畳した揚合にも有用な特徴量を検討・提案した。
次に,音声・音楽識別アルゴリズムとして,混合ガウス分布モデルおよび隠れマルコフモデルなどの統計・確率的モデルの利用について検討した。同時に,モデルのカテゴリを細分化(音楽における楽器やジャンルによるモデルの区別)した実験も行い,いくつかの新しい知見を得た。
研究成果の一部は,音声言語処理技術に関する国際会議および日本音響学会講演論文集などに発表した。

  • 研究成果

    (4件)

すべて 2006 2005

すべて 雑誌論文 (4件)

  • [雑誌論文] 時間的特徴を用いた音響信号中の音カテゴリ検出2006

    • 著者名/発表者名
      谷口徹, 大川茂樹, 誉田雅彰, 白井克彦
    • 雑誌名

      日本音響学会講演論文集 2-4-16

      ページ: 48

  • [雑誌論文] Discrimination of speech, musical instruments and singing voices using the temporal patterns of sinusoidal segments in audio signals2005

    • 著者名/発表者名
      T.Taniguchi, A.Adachi, S.Okawa, M.Honda, K.Shirai
    • 雑誌名

      Proc.Interspeech 2005 1

      ページ: 589-592

  • [雑誌論文] Sinusoidal Segmentの時間的特徴を用いた音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出2005

    • 著者名/発表者名
      谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦
    • 雑誌名

      日本音響学会講演論文集 2-6-5

      ページ: 267-268

  • [雑誌論文] Knowledge enhanced VR annotating environment for collaborative design2005

    • 著者名/発表者名
      S.Aubry, I.Thouvenin, D.Lenne, S.Okawa
    • 雑誌名

      Virtual Concept 2005 16-3

      ページ: 101-104

URL: 

公開日: 2007-04-02   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi