2016 Fiscal Year Annual Research Report
A study on sound category clustering for auditory scene analysis
Project/Area Number |
26330203
|
Research Institution | Chiba Institute of Technology |
Principal Investigator |
大川 茂樹 千葉工業大学, 先進工学部, 教授 (40306395)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 音環境理解 / 音クラスタリング / 機械学習 / 音環境デザイン |
Outline of Annual Research Achievements |
本研究は、我々の身の回りに日常的に存在する様々な音の物理的および聴覚心理的カテゴリを合理的に分類する方法と、様々な音響事象のカテゴリ識別技術を検討することを目標とした。実施3年目かつ最終年度の平成28年度は、まず、前年度までに引き続き、音カテゴリのクラスタリングおよび音カテゴリ識別のためのアルゴリズムの検討をおこなった。それまでに実装したGMM(混合ガウス分布モデル)やディープニューラルネットワーク(DNN)モデルに加え、非負値行列因子分解(NMF)に基づく特徴量に関する検討も実施し、識別器にSVMを用いた実験の結果、最も良い条件下で81.7%の音カテゴリ識別率を得た。タスクに様々なバリエーションが存在し得るため、当初計画した時点での目標を達成できたかを判断するのは難しいが、具体的な音カテゴリとして「車の走行音・音声・電車の走行音・水の流れる音」という条件を設定し、それぞれ300個の学習データを与える条件下では一定レベルの成果に到達できたと考えている。また、2年目に引き続き、音環境理解や音環境デザインに関連付けて小規模空間で発生する音を制御する際にロボティクス技術を応用する手法についての検討を継続し、小型ロボットに調音パネル(残響可変装置)を取り付けて自律的な走行をさせることで、会議室等の空間における音環境を制御するための実験的検討を実施した。この成果は日本音響学会研究発表会や日米音響学会ジョイントミーティングで発表した。
|