研究概要 |
本研究は,音声・楽音・環境音・雑音など我々の身の回りに日常的に存在する様々な音響事象の物理的および聴覚心理的カテゴリを合理的に分類する方法と,任意の音響事象のカテゴリ識別を行う技術を検討することを目的とするものである.研究初年度である平成20年度は,主に次の3点に関する作業および検討を実施した. (1)音響事象カテゴリ識別実験用データとして,既存の音声・楽音・環境音・雑音のデータを収集・整理した.様々な研究機関で集められているデータベースを有効活用し,データ収録における効率化および評価基準の共通化を図った.また,実放送音源としてTVやラジオの音声を収録した.(2)分類方法を定義するための予備実験として,各種音データを被験者に聴取させ,合理的な音カテゴリの表現方法について検討した.データの一部に対しては目視で情報内容に関するタグ付けを行った。(3)種々の音カテゴリを分類・識別するのに有効な音響的特徴量として,スペクトル形状に基づく静的特徴と比較的短時間の時間変化を表現するための動的特徴,さらに長時間にわたる変化が表現できるような大域的特徴について検討した.各々の音源の特徴を熟考しつつ,音響信号中の支配的な成分を検出・追跡することにより,各種の音カテゴリが重畳した場合にも有用な特徴量を検討・提案した.これに関連して,楽音中の音声情報を強調する枠組みとして,正弦波トラジェクトリを用いたアルゴリズムについて検証し,日本音響学会誌に論文を発表した.
|