2009 Fiscal Year Annual Research Report
音響事象カテゴリの分類および識別に関する基礎的研究
Project/Area Number |
20500162
|
Research Institution | Chiba Institute of Technology |
Principal Investigator |
大川 茂樹 Chiba Institute of Technology, 工学部, 准教授 (40306395)
|
Keywords | 音響事象カテゴリ / 音声音楽識別 / 音声認識 / 信号処理 / 聴覚情景分析 |
Research Abstract |
本研究は,音声・楽音・環境音・雑音など我々の身の回りに日常的に存在する様々な音響事象の物理的および聴覚心理的カテゴリを合理的に分類する方法と,任意の音響事象のカテゴリ識別を行う技術を検討することを目的とするものである.研究2年目である平成21年度は,主に次の3点に関する作業および検討を実施した. (1) 音響事象カテゴリの分類・識別のためのアルゴリズムとして,混合ガウス分布(GMM)モデルや隠れマルコフモデル(HMM)などの統計的モデルの利用法を検討した。この際,音の種類による音響的特徴の多様性を考慮した最適なモデル化法についても考察した。最初に比較的簡単なタスクを設定し,条件を変えつつ実験を行った。また,モデルカテゴリを細分化・階層化した実験も併せて行った。(2)音響的特徴量および識別アルゴリズムを種々の音データに適用して得られた結果を用いて,適切と思われる音カテゴリの分類基準について検討した。1つのデータに対して複数あるいは階層的な分類基準を利用することも考慮した。提案した分類基準の有用性について比較・評価した。(3)音響事象カテゴリの識別に関して,音声・音楽・環境音データに対して提案したいくつかの特徴量を用いた実験を行った。中でもBlock Cepstrum Fluxと呼ばれる特徴量とSVMを組み合わせた識別実験で良好な性能を得た。これに関連して,日本音響学会研究発表会において研究成果を発表した.
|