2006 Fiscal Year Annual Research Report
環境音の検出及び識別法の研究 -環境音と音声のシームレスな認識を目指して-
Project/Area Number |
17500114
|
Research Institution | Nagasaki University |
Principal Investigator |
松永 昭一 長崎大学, 工学部, 教授 (90380815)
|
Keywords | 音源識別 / 音響特徴 / パラメータ / 音声 / スペクトル / 情動 |
Research Abstract |
種々の環境音の存在は,環境音の自動識別を困難にする.人間が明らかに区別できる環境音でさえ種類数が多いため、そのモデル化が難しいだけではなく、データベースの構築も大量に必要となりコスト的にも現実的とは言えない.また、環境音を高精度に検出できれば、インデクシングの自動化や背景音がある中での音声認識の精度が向上できると期待されている.そこで我々は、環境音のクラスタリングを行い、その環境音クラスを用いて音の種類(音声、音楽、雑音、無音)を識別することで、音の識別精度を向上させることを検討した.従来の研究では、音を識別するパラメータとして、1:スペクトルの時間的変化、2:スペクトルの傾き、3:白色雑音との近さ、4:ピッチ、5:パワー、6:中心周波数、7:中心周波数のバンド幅を用いて音の識別能力を向上させてきた.本研究では、これらのパラメータ値を用いてクラスタリングを行う手法を2通り考案し、その精度を検証した.一つの方法は、フレームベースのパラメータの値を用いてクラスタリングを行い、その後で時間軸上でスムージングを行う方法である.もう一方は、雑音の種類のラベルを基にクラスタリングを行う方法である.これらのクラスタ環境音を用いた識別実験の結果、両方法ともに効果があることがわかった。 また環境音の一つである、乳児の泣き声に着目し、その泣き声から乳児の情動を判断する試みを行った.環境音にはその音を聞いた人間に意味がある音がある.本研究はその環境音の理解として進めている.本研究では乳児の泣き声に対して、音響的特徴毎にラベル付けを行った.また、泣き声に含まれている情動を判断する為に、母親の判断だけでなく、他者による主観評価実験の結果も考慮して行った.識別の方法は音声認識に最も良く用いられる統計的手法である隠れマルコフモデルを用いた.
|
Research Products
(1 results)