2007 Fiscal Year Annual Research Report
環境音の検出及び及び識別法の研究 -環境音と音声のシームレスな認識を目指して-
Project/Area Number |
17500114
|
Research Institution | Nagasaki University |
Principal Investigator |
松永 昭一 Nagasaki University, 工学部, 教授 (90380815)
|
Keywords | 音源識別 / 音響特徴 / パラメータ / 音声 / スぺクトル |
Research Abstract |
環境音を高精度に検出できれば、放送番組等のインデクシングの自動化や背景音がある中での音声認識の精度が向上できると期待されている.そこで我々は、ニュース放送のコンテンツを題材として環境音のクラスタリングを行い、その環境音クラスを用いて音の種類(音声、音楽、雑音、無音)を識別することで、音の識別精度を向上させることを検討した。本研究では、これらの音響特徴パラメータのクラスタリングを行う手法を2通り考案し、その精度を検証した。一つの方法は、フレームベースのパラメータの値を用いてクラスタリングを行い、その後で時間軸上でスムージングを行う方法である.もう一方は、雑音の種類のラベルを基にクラスタリングを行う方法である。これらのクラスタ環境音を用いた識別実験の結果、後者の方法がクラス数によらず安定した効果があることがわかった。また、環境音のモデルの混合分布の分布数を増やして、音源の検出精度を比較する実験を行った。次に、環境音の検出情報と無音区間の検出情報を統合したインデクシングを行った。ここでは、ニュース番組におけるトピック単位の検出実験を音コンテンツのみを用いて行い、約70%のトピック区間の再現率を得た。 また環境音の一つである、乳児の泣き声に着目し、その泣き声から乳児の情動を判断する試みを行った。本研究では乳児の泣き声に対して、どのような感情が含まれているかを判断するために、主観評価実験を行い、その主観評価値を用いてエントロピーを基準にしたクラスタリングを行った。この結果、「怒り」「悲しみ」に関するクラスタと「眠い」「甘え」に関するクラスタに二分されることがわかった。また、この結果を用いて情動識別実験を行ったところ70%程度の良好な識別結果を得た。
|
Research Products
(3 results)