研究課題/領域番号 |
22K12102
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 金沢工業大学 |
研究代表者 |
島内 末廣 金沢工業大学, 工学部, 教授 (30828702)
|
研究分担者 |
青木 茂明 金沢工業大学, 工学部, 教授 (10396161)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | 短時間スペクトル / 音響信号 / 正則性 |
研究開始時の研究の概要 |
信号処理・機械学習・深層学習などの融合・発展により、信号の強調、分離、識別などの技術は大きく進展してきた。音声、楽音、生体音など音響信号を対象とした特徴分析では、信号の非定常な性質を時間特性と周波数特性の両面から捉えるために、短時間スペクトルの情報がよく用いられる。多くの場合、主として活用されるのは、スペクトルの振幅成分の特徴であり、不規則性が強く扱いが難しい位相成分については、有効な情報を余すことなく抽出・活用できているとは言い難い。 本研究では、振幅と位相の情報を相補的に余すことなく活用するため、短時間スペクトルの新たな解釈に基づく特徴表現法の創出を目指し、音響処理への応用に資する。
|
研究実績の概要 |
音声、楽音、機械音、環境音、生体音など音響信号を対象とした特徴分析では、信号の非定常な性質を時間特性と周波数特性の両面から捉えるために、短時間スペクトルの情報がよく用いられる。多くの場合、主として活用されるのは、スペクトルの振幅成分の特徴であり、不規則性が強く扱いが難しい位相成分については、有効な情報を余すことなく抽出・活用できているとは言い難い。 そこで、本研究では、振幅と位相の情報を相補的に余すことなく活用するため、短時間スペクトルの新たな解釈に基づく特徴表現法を創出し、音響処理への応用に資することを目指す。 当該年度においては、前年度に引き続き、位相成分の不規則性を回避する手法の検討を進めた。従来、複素スペクトルの位相値が複素平面上の原点を基準として定義されているために、スペクトル値が原点を通過して変化した際に位相値が不連続となる問題に着目し、これを回避するために、複素平面上の原点を基準とするのではなく、実数軸、虚数軸に直交する3次元空間上の軸上の点を基準として、位相角を再定義することを考えた。前処理として再定義した位相角を入力とする雑音抑圧処理システムを深層学習に基づき構築し、位相角を算出する際の基準点の違いが性能に与える影響を評価した。その結果、最適な基準点の座標を実験的に明らかにし、従来の定義による位相角を入力として与えた場合よりも、出力信号の歪が小さくなることを確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
前年度末時点で、雑音抑圧処理への応用の予備検討の結果、本研究により再定義した位相角を算出する際の3次元空間上の基準点の最適化が新たな課題として抽出された。今年度は、当該の基準点の最適化の課題にまず取組み、雑音抑圧処理への応用において、最適化が性能に与える効果を確認した。しかしながら、当初計画していたスペクトルの正則性に着目した位相情報と振幅情報との関連性についても、これらの最適化を踏まえた検証が必要となり、全体として進捗にやや遅れが生じる結果となった。
|
今後の研究の推進方策 |
3次元に拡張された基準点により定義される連続性が担保された位相情報と振幅情報の関連性を考慮した特徴表現、および、それを活用した音響処理の応用システムの性能検証を進めていく予定である。
|