• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

質感認識メカニズムに基づく異常音検知の理解

公募研究

研究領域実世界の奥深い質感情報の分析と生成
研究課題/領域番号 23H04344
研究種目

学術変革領域研究(A)

配分区分補助金
審査区分 学術変革領域研究区分(Ⅳ)
研究機関北陸先端科学技術大学院大学

研究代表者

鵜木 祐史  北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (00343187)

研究期間 (年度) 2023-04-01 – 2025-03-31
研究課題ステータス 交付 (2024年度)
配分額 *注記
7,800千円 (直接経費: 6,000千円、間接経費: 1,800千円)
2024年度: 3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2023年度: 3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
キーワード異常音検知 / 音色属性 / STM分析 / 質感認識メカニズム / 質感認識 / スペクトル変調・時間変調分析 / 音色知覚 / 聴知覚メカニズム / 音質評価指標
研究開始時の研究の概要

本研究では,音源=異常状態によって発せられる音が,音環境を通じてヒトに聴知覚され,音の深奥質感として異常か正常か理解されるものと仮定する.また,ヒトが音から異常状態を検知する際,どのような音響的な手がかりを利用しているのか.音の変調スペクトルとその知覚的因子(音の粗さや変動感,甲高さ,明るさなど)が,深奥質感として異常音検知にどのように関係するか,聴覚特性を考慮したスペクトル変調・時間変調(STM)分析を利用して明らかにする.これらの検討から,音の深奥質感として,ヒトの異常音検知のメカニズムを理解し,それに基づいた機械による異常音検知の実現可能性を検討する.

研究実績の概要

本研究では,音源=異常状態によって発せられる音が,音環境を通じてヒトに聴知覚され,音の深奥質感として異常か正常か理解されるものと仮定する.また,ヒトが音から異常状態を検知する際,どのような音響的な手がかりを利用しているのか.音の変調スペクトルとその知覚的因子(音の粗さや変動感,甲高さ,明るさなど)が,深奥質感として異常音検知にどのように関係するか,聴覚特性を考慮したスペクトル変調・時間変調(STM)分析を利用して明らかにする.これらの検討から,音の深奥質感として,ヒトの異常音検知のメカニズムを理解し,それに基づいた機械による異常音検知の実現可能性を検討する.
2023年度は,音環境・聴覚特性を考慮した音の振幅包絡線情報からSTM分析による特徴表現までの一連の処理体系を,聴覚フィルタバンク,Hilbert変換による包絡線情報の抽出,変調フィルタバンクによる時間変調分析,ケプストラムによるスペクトル変調分析,2次元周波数分析によるSTM分析のシーケンシャルな処理結合ととらえ,MATLABを利用して実装した.次に,DCASE Challenge などで公開された異常音データベース(MIMII)を利用して,知覚的因子(ラフネス,変動強度,シャープネス)といった音色属性の指標と異常音検知の関係を客観評価実験により調べた.その結果,すべてに対して共通な因子を見つけられなかったが,異常状態あるいは音源に依存して利用できる知覚的因子があることがわかった.最後に,これら特徴抽出に深層学習ベースの識別器と組み合わせることで,MIMIIデータに対する異常音検知,ADD2022/ADD2023で提供されたフェイク音声の異常音検知を実現する方法を提案した.いずれも良好な精度で異常音を検出できることを明らかにした.

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

既にSTM分析の核となる処理体系を確立し,異常音検知にSTM分析で利用される因子あるいは音響特徴が有効であることを確認することができた.さらに,これをベースとする音響特徴処理をベースに,古典的な識別器(例えばサポートベクターマシン)や深層学習ベースの識別器と組み合わせることで,MIMIIデータに対する異常音検知,ADD2022/ADD2023で提供されたフェイク音声の異常音検知を実現する方法を提案することができた.これらの評価では,適合率と再現率の調和平均であるFスコアや等価エラー率(EER)などを利用したが,十分に精度の高い異常音検知を実現することができた.今後は,Fスコアを1に,あるいはEERを0に近づけるための方略を検討する.申請時に計画した初年度(2023年度)の計画以上の大きな進捗を得られたことから,(1)の区分であると判断した.

今後の研究の推進方策

STM分析の核となる処理体系を確立することができた.今後は,音色属性に関わる特徴とSTMで表現される特徴の関係性を明らかにすることで,異常音検知に役立つ物理特徴をSTM分析と音響物理の逆の関係性から推測することができるかもしれない.このアプローチから音響特徴をあぶりだすことにより,深奥質感としての異常音知覚のメカニズム解明に踏み込むことができるかもしれない.また,この検討から初年度に提案したいくつかの異常音検知の方法を改良することもできるかもしれない.

報告書

(1件)
  • 2023 実績報告書
  • 研究成果

    (11件)

すべて 2024 2023 その他

すべて 国際共同研究 (1件) 雑誌論文 (5件) (うち国際共著 1件、 査読あり 5件、 オープンアクセス 3件) 学会発表 (5件) (うち国際学会 2件)

  • [国際共同研究] NECTEC/タマサート大学SIIT(タイ)

    • 関連する報告書
      2023 実績報告書
  • [雑誌論文] Computational models of auditory sensation important for sound quality on basis of either gammatone or gammachirp auditory filterbank2024

    • 著者名/発表者名
      Isoyama Takuto、Kidani Shunsuke、Unoki Masashi
    • 雑誌名

      Applied Acoustics

      巻: 218 ページ: 109914-109914

    • DOI

      10.1016/j.apacoust.2024.109914

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Anomalous Sound Detection for Industrial Machines Using Acoustical Features Related to Timbral Metrics2023

    • 著者名/発表者名
      Ota Yasuji、Unoki Masashi
    • 雑誌名

      IEEE Access

      巻: 11 ページ: 70884-70897

    • DOI

      10.1109/access.2023.3294334

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] A Survey of Audio Classification Using Deep Learning2023

    • 著者名/発表者名
      Zaman Khalid、Sah Melike、Direkoglu Cem、Unoki Masashi
    • 雑誌名

      IEEE Access

      巻: 11 ページ: 106620-106649

    • DOI

      10.1109/access.2023.3318015

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Analysis of Spectro-Temporal Modulation Representation for Deep-Fake Speech Detection2023

    • 著者名/発表者名
      Cheng Haowei、Mawalim Candy Olivia、Li Kai、Wang Lijun、Unoki Masashi
    • 雑誌名

      Proc. APSIPA2023

      巻: - ページ: 1822-1829

    • DOI

      10.1109/apsipaasc58517.2023.10317309

    • 関連する報告書
      2023 実績報告書
    • 査読あり
  • [雑誌論文] Data-driven Non-uniform Filterbanks Based on F-ratio for Machine Anomalous Sound Detection2023

    • 著者名/発表者名
      Li Kai、Tran Dung Kim、Lu Xugang、Akagi Masato、Unoki Masashi
    • 雑誌名

      Proc. EUSIPCO2023

      巻: - ページ: 201-205

    • DOI

      10.23919/eusipco58844.2023.10289922

    • 関連する報告書
      2023 実績報告書
    • 査読あり
  • [学会発表] 聴覚フィルタバンクを用いた時変動音のラウドネス計算法の構築2023

    • 著者名/発表者名
      磯山拓都, 木谷俊介, 鵜木祐史
    • 学会等名
      日本音響学会2023年度秋季研究発表会(名古屋大学)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 産業機器の異常音検知に向けた音色関連特徴量の検討2023

    • 著者名/発表者名
      大田恭士, 鵜木祐史
    • 学会等名
      日本音響学会2023年度秋季研究発表会(名古屋大学)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] Analysis of Spectro-Temporal Modulation Representation for Deep-Fake Speech Detection2023

    • 著者名/発表者名
      Haowei Cheng, Candy Olivia Mawalim, Kai Li, Lijun Wang, Masashi Unoki
    • 学会等名
      APSIPA ASC 2023(Taipei)
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] Data-driven Non-uniform Filterbanks Based on F-ratio for Machine Anomalous Sound Detection2023

    • 著者名/発表者名
      Kai Li, Dung Kim Tran, Xugang Lu, Masato Akagi, Masashi Unoki
    • 学会等名
      EUSIPCO2023 (Helsink, Finland)
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] 音色に関連づけた信号処理手法による異常音検知の一検討2023

    • 著者名/発表者名
      大田 恭士, 鵜木 祐史
    • 学会等名
      第38回信号処理シンポジウム(京都テルサ)
    • 関連する報告書
      2023 実績報告書

URL: 

公開日: 2023-04-13   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi