Understanding Anomalous Sound Detection Based on SHITSUKAN Recognition Mechanism

Publicly Offered Research

Project Area	Analysis and synthesis of deep SHITSUKAN information in the real world
Project/Area Number	23H04344
Research Category	Grant-in-Aid for Transformative Research Areas (A)
Allocation Type	Single-year Grants
Review Section	Transformative Research Areas, Section (IV)
Research Institution	Japan Advanced Institute of Science and Technology
Principal Investigator	鵜木祐史北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (00343187)
Project Period (FY)	2023-04-01 – 2025-03-31
Project Status	Granted (Fiscal Year 2024)
Budget Amount *help	¥7,800,000 (Direct Cost: ¥6,000,000、Indirect Cost: ¥1,800,000) Fiscal Year 2024: ¥3,900,000 (Direct Cost: ¥3,000,000、Indirect Cost: ¥900,000) Fiscal Year 2023: ¥3,900,000 (Direct Cost: ¥3,000,000、Indirect Cost: ¥900,000)
Keywords	異常音検知 / 音色属性 / STM分析 / 質感認識メカニズム / 質感認識 / スペクトル変調・時間変調分析 / 音色知覚 / 聴知覚メカニズム / 音質評価指標
Outline of Research at the Start	本研究では，音源＝異常状態によって発せられる音が，音環境を通じてヒトに聴知覚され，音の深奥質感として異常か正常か理解されるものと仮定する．また，ヒトが音から異常状態を検知する際，どのような音響的な手がかりを利用しているのか．音の変調スペクトルとその知覚的因子（音の粗さや変動感，甲高さ，明るさなど）が，深奥質感として異常音検知にどのように関係するか，聴覚特性を考慮したスペクトル変調・時間変調（STM）分析を利用して明らかにする．これらの検討から，音の深奥質感として，ヒトの異常音検知のメカニズムを理解し，それに基づいた機械による異常音検知の実現可能性を検討する．
Outline of Annual Research Achievements	本研究では，音源＝異常状態によって発せられる音が，音環境を通じてヒトに聴知覚され，音の深奥質感として異常か正常か理解されるものと仮定する．また，ヒトが音から異常状態を検知する際，どのような音響的な手がかりを利用しているのか．音の変調スペクトルとその知覚的因子（音の粗さや変動感，甲高さ，明るさなど）が，深奥質感として異常音検知にどのように関係するか，聴覚特性を考慮したスペクトル変調・時間変調（STM）分析を利用して明らかにする．これらの検討から，音の深奥質感として，ヒトの異常音検知のメカニズムを理解し，それに基づいた機械による異常音検知の実現可能性を検討する． 2023年度は，音環境・聴覚特性を考慮した音の振幅包絡線情報からSTM分析による特徴表現までの一連の処理体系を，聴覚フィルタバンク，Hilbert変換による包絡線情報の抽出，変調フィルタバンクによる時間変調分析，ケプストラムによるスペクトル変調分析，2次元周波数分析によるSTM分析のシーケンシャルな処理結合ととらえ，MATLABを利用して実装した．次に，DCASE Challenge などで公開された異常音データベース（MIMII）を利用して，知覚的因子（ラフネス，変動強度，シャープネス）といった音色属性の指標と異常音検知の関係を客観評価実験により調べた．その結果，すべてに対して共通な因子を見つけられなかったが，異常状態あるいは音源に依存して利用できる知覚的因子があることがわかった．最後に，これら特徴抽出に深層学習ベースの識別器と組み合わせることで，MIMIIデータに対する異常音検知，ADD2022/ADD2023で提供されたフェイク音声の異常音検知を実現する方法を提案した．いずれも良好な精度で異常音を検出できることを明らかにした．
Current Status of Research Progress	Current Status of Research Progress 1: Research has progressed more than it was originally planned. Reason 既にSTM分析の核となる処理体系を確立し，異常音検知にSTM分析で利用される因子あるいは音響特徴が有効であることを確認することができた．さらに，これをベースとする音響特徴処理をベースに，古典的な識別器（例えばサポートベクターマシン）や深層学習ベースの識別器と組み合わせることで，MIMIIデータに対する異常音検知，ADD2022/ADD2023で提供されたフェイク音声の異常音検知を実現する方法を提案することができた．これらの評価では，適合率と再現率の調和平均であるFスコアや等価エラー率（EER）などを利用したが，十分に精度の高い異常音検知を実現することができた．今後は，Fスコアを1に，あるいはEERを0に近づけるための方略を検討する．申請時に計画した初年度（2023年度）の計画以上の大きな進捗を得られたことから，(1)の区分であると判断した．
Strategy for Future Research Activity	STM分析の核となる処理体系を確立することができた．今後は，音色属性に関わる特徴とSTMで表現される特徴の関係性を明らかにすることで，異常音検知に役立つ物理特徴をSTM分析と音響物理の逆の関係性から推測することができるかもしれない．このアプローチから音響特徴をあぶりだすことにより，深奥質感としての異常音知覚のメカニズム解明に踏み込むことができるかもしれない．また，この検討から初年度に提案したいくつかの異常音検知の方法を改良することもできるかもしれない．

Report

(1 results)

2023 Annual Research Report

Research Products
(11 results)

All 2024 2023 Other

All Int'l Joint Research (1 results) Journal Article (5 results) (of which Int'l Joint Research: 1 results, Peer Reviewed: 5 results, Open Access: 3 results) Presentation (5 results) (of which Int'l Joint Research: 2 results)

[Int'l Joint Research] NECTEC/タマサート大学SIIT(タイ)
- Related Report
  2023 Annual Research Report
[Journal Article] Computational models of auditory sensation important for sound quality on basis of either gammatone or gammachirp auditory filterbank2024
- Author(s)
  Isoyama Takuto、Kidani Shunsuke、Unoki Masashi
- Journal Title
  
  Applied Acoustics
  
  Volume: 218 Pages: 109914-109914
- DOI
  10.1016/j.apacoust.2024.109914
- Related Report
  2023 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] Anomalous Sound Detection for Industrial Machines Using Acoustical Features Related to Timbral Metrics2023
- Author(s)
  Ota Yasuji、Unoki Masashi
- Journal Title
  
  IEEE Access
  
  Volume: 11 Pages: 70884-70897
- DOI
  10.1109/access.2023.3294334
- Related Report
  2023 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] A Survey of Audio Classification Using Deep Learning2023
- Author(s)
  Zaman Khalid、Sah Melike、Direkoglu Cem、Unoki Masashi
- Journal Title
  
  IEEE Access
  
  Volume: 11 Pages: 106620-106649
- DOI
  10.1109/access.2023.3318015
- Related Report
  2023 Annual Research Report
- Peer Reviewed / Open Access / Int'l Joint Research
[Journal Article] Analysis of Spectro-Temporal Modulation Representation for Deep-Fake Speech Detection2023
- Author(s)
  Cheng Haowei、Mawalim Candy Olivia、Li Kai、Wang Lijun、Unoki Masashi
- Journal Title
  
  Proc. APSIPA2023
  
  Volume: - Pages: 1822-1829
- DOI
  10.1109/apsipaasc58517.2023.10317309
- Related Report
  2023 Annual Research Report
- Peer Reviewed
[Journal Article] Data-driven Non-uniform Filterbanks Based on F-ratio for Machine Anomalous Sound Detection2023
- Author(s)
  Li Kai、Tran Dung Kim、Lu Xugang、Akagi Masato、Unoki Masashi
- Journal Title
  
  Proc. EUSIPCO2023
  
  Volume: - Pages: 201-205
- DOI
  10.23919/eusipco58844.2023.10289922
- Related Report
  2023 Annual Research Report
- Peer Reviewed
[Presentation] 聴覚フィルタバンクを用いた時変動音のラウドネス計算法の構築2023
- Author(s)
  磯山拓都, 木谷俊介, 鵜木祐史
- Organizer
  日本音響学会2023年度秋季研究発表会（名古屋大学）
- Related Report
  2023 Annual Research Report
[Presentation] 産業機器の異常音検知に向けた音色関連特徴量の検討2023
- Author(s)
  大田恭士, 鵜木祐史
- Organizer
  日本音響学会2023年度秋季研究発表会（名古屋大学）
- Related Report
  2023 Annual Research Report
[Presentation] Analysis of Spectro-Temporal Modulation Representation for Deep-Fake Speech Detection2023
- Author(s)
  Haowei Cheng, Candy Olivia Mawalim, Kai Li, Lijun Wang, Masashi Unoki
- Organizer
  APSIPA ASC 2023（Taipei）
- Related Report
  2023 Annual Research Report
- Int'l Joint Research
[Presentation] Data-driven Non-uniform Filterbanks Based on F-ratio for Machine Anomalous Sound Detection2023
- Author(s)
  Kai Li, Dung Kim Tran, Xugang Lu, Masato Akagi, Masashi Unoki
- Organizer
  EUSIPCO2023 (Helsink, Finland)
- Related Report
  2023 Annual Research Report
- Int'l Joint Research
[Presentation] 音色に関連づけた信号処理手法による異常音検知の一検討2023
- Author(s)
  大田恭士, 鵜木祐史
- Organizer
  第38回信号処理シンポジウム（京都テルサ）
- Related Report
  2023 Annual Research Report

Understanding Anomalous Sound Detection Based on SHITSUKAN Recognition Mechanism

Principal Investigator

鵜木 祐史 北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (00343187)

¥7,800,000 (Direct Cost: ¥6,000,000、Indirect Cost: ¥1,800,000)

Current Status of Research Progress

Reason

Report

Research Products

[Int'l Joint Research] NECTEC/タマサート大学SIIT(タイ)

Related Report

[Journal Article] Computational models of auditory sensation important for sound quality on basis of either gammatone or gammachirp auditory filterbank2024

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Anomalous Sound Detection for Industrial Machines Using Acoustical Features Related to Timbral Metrics2023

Author(s)

Journal Title

DOI

Related Report

[Journal Article] A Survey of Audio Classification Using Deep Learning2023

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Analysis of Spectro-Temporal Modulation Representation for Deep-Fake Speech Detection2023

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Data-driven Non-uniform Filterbanks Based on F-ratio for Machine Anomalous Sound Detection2023

Author(s)

Journal Title

DOI

Related Report

[Presentation] 聴覚フィルタバンクを用いた時変動音のラウドネス計算法の構築2023

Author(s)

Organizer

Related Report

[Presentation] 産業機器の異常音検知に向けた音色関連特徴量の検討2023

Author(s)

Organizer

Related Report

[Presentation] Analysis of Spectro-Temporal Modulation Representation for Deep-Fake Speech Detection2023

Author(s)

Organizer

Related Report

[Presentation] Data-driven Non-uniform Filterbanks Based on F-ratio for Machine Anomalous Sound Detection2023

Author(s)

Organizer

Related Report

[Presentation] 音色に関連づけた信号処理手法による異常音検知の一検討2023

Author(s)

Organizer

Related Report

鵜木祐史北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (00343187)