音声・音楽識別技術に関する基礎的研究

Research Project

Project/Area Number	16700189
Research Category	Grant-in-Aid for Young Scientists (B)
Allocation Type	Single-year Grants
Research Field	Perception information processing/Intelligent robotics
Research Institution	Chiba Institute of Technology
Principal Investigator	大川茂樹千葉工業大学, 工学部, 助教授 (40306395)
Project Period (FY)	2004 – 2006
Project Status	Completed (Fiscal Year 2006)
Budget Amount *help	¥2,900,000 (Direct Cost: ¥2,900,000) Fiscal Year 2006: ¥800,000 (Direct Cost: ¥800,000) Fiscal Year 2005: ¥900,000 (Direct Cost: ¥900,000) Fiscal Year 2004: ¥1,200,000 (Direct Cost: ¥1,200,000)
Keywords	音声音楽識別 / 音声認識 / 楽音分析 / 音響特徴量
Research Abstract	本研究は,TVやラジオの放送音声のように,音声や音楽,その他の音が混入した音響データに対して,音声や音楽の時区間を自動的に識別し,その結果をメタデータ(本来のデータに付加的に与えるデータ)として付与することを目的としている。現在に至るまで,依然として音声・音楽識別に対する決定的な手法が見出されていないことを鑑みて,有用な特徴量の検討,識別手法(アルゴリズム)の検討,実データ(放送音源など)に対する検証,の3つの論点について明らかにすることを目指す。研究最終年度の本年度は,有用な特徴量の検討として,前年度に検討した音響信号中に支配的に現れる周波数成分の追跡手法に加えて,信号の瞬時位相成分の時間変化に着目し,基礎的な音カテゴリ識別実験および短音節・連続単語に対する音声認識実験を通して,その有用性および識別性能を検討した。さらに,音声・音楽識別のためのアルゴリズムの検討として,混合ガウス分布や隠れマルコフモデルなどを利用した統計確率的モデルについての実験および評価を行うとともに,新たにニューラルネットワークと隠れマルコフモデルをハイブリッドに組み合わせたTRAPsモデルに関する検討を行った。これらの実験的検討により,音声・音楽識別,音カテゴリ識別,および音声認識に関するいくつかの新しい知見を得た。当初の研究計画で挙げた論点のうち,有用な特徴量の検討,識別手法の検討の2つについて,目標をほぼ達成し得たものと考える。研究成果の一部は,音声言語技術に関する国際会議および日本音響学会講演論文集などに発表した。

Report

(3 results)

Research Products
(13 results)

All 2007 2006 2005 2004

All Journal Article (13 results)

[Journal Article] 長時間瞬時位相分析を用いた話し言葉音声認識2007
- Author(s)
  久保陽太郎, 大川茂樹, 榑松明, 白井克彦
- Journal Title
  
  日本音響学会講演論文集 3-10-9
  
  Pages: 121-122
- Related Report
  2006 Annual Research Report
[Journal Article] 話し言葉に見られる音響的曖昧性の抽出に関する検討2006
- Author(s)
  細貝則充, 沖田加奈恵, 會田卓也, 大川茂樹
- Journal Title
  
  日本音響学会講演論文集 1-Q-11
  
  Pages: 259-260
- Related Report
  2006 Annual Research Report
[Journal Article] An analysis of note deviation manner in piano music2006
- Author(s)
  Y.Toda, Y.Nakayama, T.Okura, N.Yasuda, S.Okawa
- Journal Title
  
  Proc. ASA/ASJ Joint Meeting 1aMU3
  
  Pages: 3005-3005
- Related Report
  2006 Annual Research Report
[Journal Article] An analysis of acoustic deviation manner in spontaneous speech2006
- Author(s)
  N.Hosogai, K.Okita, T.Aida, S.Okawa
- Journal Title
  
  Proc. ASA/ASJ Joint Meeting 4pSC14
  
  Pages: 3293-3293
- Related Report
  2006 Annual Research Report
[Journal Article] Instantaneous Phase Analysis Using Artificial Neural Networks for Automatic Speech Recognition2006
- Author(s)
  Y.Kubo, S.Okawa, A.Kurematsu, K.Shirai
- Journal Title
  
  Proc. 2007 RISP International Workshop on Nonlinear Circuits and Signal Processing 1
  
  Pages: 321-324
- Related Report
  2006 Annual Research Report
[Journal Article] 時間的特徴を用いた音響信号中の音カテゴリ検出2006
- Author(s)
  谷口徹, 大川茂樹, 誉田雅彰, 白井克彦
- Journal Title
  
  日本音響学会講演論文集 2-4-16
  
  Pages: 48-48
- Related Report
  2005 Annual Research Report
[Journal Article] Discrimination of speech, musical instruments and singing voices using the temporal patterns of sinusoidal segments in audio signals2005
- Author(s)
  T.Taniguchi, A.Adachi, S.Okawa, M.Honda, K.Shirai
- Journal Title
  
  Proc.Interspeech 2005 1
  
  Pages: 589-592
- Related Report
  2005 Annual Research Report
[Journal Article] Sinusoidal Segmentの時間的特徴を用いた音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出2005
- Author(s)
  谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦
- Journal Title
  
  日本音響学会講演論文集 2-6-5
  
  Pages: 267-268
- Related Report
  2005 Annual Research Report
[Journal Article] Knowledge enhanced VR annotating environment for collaborative design2005
- Author(s)
  S.Aubry, I.Thouvenin, D.Lenne, S.Okawa
- Journal Title
  
  Virtual Concept 2005 16-3
  
  Pages: 101-104
- Related Report
  2005 Annual Research Report
[Journal Article] 音声・楽器音・歌声が重畳した音響信号申のカテゴリ識別2005
- Author(s)
  谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦
- Journal Title
  
  電子情報通信学会技術研究報告 SP2004-153
  
  Pages: 49-54
- Related Report
  2004 Annual Research Report
[Journal Article] 生活環境音を記録し音響的特徴を用いて要約するインタフェースの提案2005
- Author(s)
  大塚昭徳, 伊丹徳重, 坂倉美保, 冨塚清史, 大川茂樹
- Journal Title
  
  情報処理学会全国大会講演論文集 2
  
  Pages: 374-375
- NAID
  170000170314
- Related Report
  2004 Annual Research Report
[Journal Article] 音声・楽器音・歌声が混在した音響信号中のカテゴリ検出2005
- Author(s)
  谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦
- Journal Title
  
  日本音響学会講演論文集 3-P-13
  
  Pages: 265-266
- Related Report
  2004 Annual Research Report
[Journal Article] Discrimination of speech, musical instruments and singing voices using the temporal patterns of sinusoidal segments in audio signals2004
- Author(s)
  T.Taniguchi, A.Adachi, S.Okawa, M.Honda, K.Shirai
- Journal Title
  
  Proc.International Conference on Speech and Language Technology 3-B-4(CD-ROM)
- Related Report
  2004 Annual Research Report

音声・音楽識別技術に関する基礎的研究

Principal Investigator

大川 茂樹 千葉工業大学, 工学部, 助教授 (40306395)

¥2,900,000 (Direct Cost: ¥2,900,000)

Report

Research Products

[Journal Article] 長時間瞬時位相分析を用いた話し言葉音声認識2007

Author(s)

Journal Title

Related Report

[Journal Article] 話し言葉に見られる音響的曖昧性の抽出に関する検討2006

Author(s)

Journal Title

Related Report

[Journal Article] An analysis of note deviation manner in piano music2006

Author(s)

Journal Title

Related Report

[Journal Article] An analysis of acoustic deviation manner in spontaneous speech2006

Author(s)

Journal Title

Related Report

[Journal Article] Instantaneous Phase Analysis Using Artificial Neural Networks for Automatic Speech Recognition2006

Author(s)

Journal Title

Related Report

[Journal Article] 時間的特徴を用いた音響信号中の音カテゴリ検出2006

Author(s)

Journal Title

Related Report

[Journal Article] Discrimination of speech, musical instruments and singing voices using the temporal patterns of sinusoidal segments in audio signals2005

Author(s)

Journal Title

Related Report

[Journal Article] Sinusoidal Segmentの時間的特徴を用いた音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出2005

Author(s)

Journal Title

Related Report

[Journal Article] Knowledge enhanced VR annotating environment for collaborative design2005

Author(s)

Journal Title

Related Report

[Journal Article] 音声・楽器音・歌声が重畳した音響信号申のカテゴリ識別2005

Author(s)

Journal Title

Related Report

[Journal Article] 生活環境音を記録し音響的特徴を用いて要約するインタフェースの提案2005

Author(s)

Journal Title

NAID

Related Report

[Journal Article] 音声・楽器音・歌声が混在した音響信号中のカテゴリ検出2005

Author(s)

Journal Title

Related Report

[Journal Article] Discrimination of speech, musical instruments and singing voices using the temporal patterns of sinusoidal segments in audio signals2004

Author(s)

Journal Title

Related Report

大川茂樹千葉工業大学, 工学部, 助教授 (40306395)