音響信号の振幅位相関係を考慮した複素スペクトル領域音声強調と応用
Project/Area Number |
20K19827
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 61010:Perceptual information processing-related
|
Research Institution | Toyohashi University of Technology (2022) Tokyo Metropolitan University (2020-2021) |
Principal Investigator |
若林 佑幸 豊橋技術科学大学, 工学(系)研究科(研究院), 助教 (80826462)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2023: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2022: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2021: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2020: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
|
Keywords | 複素スペクトル / 位相スぺクトル / 位相復元 / 符号不定性 / 音響信号処理 / 複素領域信号処理 / アレイ信号処理 / 深層学習 / 位相信号処理 / 振幅・位相関連性 / 音声区間検出 / 振幅位相復元 / 音声強調 |
Outline of Research at the Start |
本研究は,特に周囲の雑音により音質の劣化した音響信号の強調・復元に取り組むものである.近年の音響信号処理では信号の振幅スペクトル,位相スペクトルという二つの特徴に着目し,個別で処理するものが一般的であるが,理論・実験の両面からこれらのスペクトルは強い関係性を持つことが示唆されている.この関係性に着目し,振幅・位相を統合的に取り扱うための基礎理論を構築し,信号処理へ応用する.
|
Outline of Annual Research Achievements |
本研究の目的は,音響信号の周波数解析によって得られる振幅スペクトルと位相スペクトルの関連性を考慮した音響信号強調手法の基礎理論構築とその他の音響信号処理への応用である. 従来の研究では,音響信号の時間周波数解析に基づき,振幅・位相という二つのスペクトルの挙動を利用して各種信号処理の理論・アルゴリズムの構築がなされる.本研究ではこれら二つのスペクトルに深い関連があることに着目した信号処理の理論構築と実験を行うものである. 第三年度では,第二年度で行った時間・周波数領域における振幅と位相の統計的挙動の関係性を深層学習に応用させた取り組みを発展させた.本取り組みでは,深層学習と典型的な最適化手法とを組み合わせることで,最新の従来研究よりも振幅スペクトを利用した位相スペクトルの推定性能が改善することを客観指標と被験者を募って行った聴取実験の両結果から確認し,国内会議(日本音響学会秋季研究発表会)にて発表した.さらに,この結果をまとめ,音響信号処理のトップジャーナルであるIEEE Trans. ASLPに投稿し,査読中である. また,深層学習への応用という点において,別の観点からの研究を展開させた.具体的には,位相スペクトルの符号不確定性という問題に新たに着目し,定式化を行うことで,深層学習に適用し解決を行った.不確定性問題を深層学習の学習に取り込むことで,位相スペクトルの推定性能に改善が見られ,この問題提起が有用であることを示した.この結果は国際学会APSIPAへ投稿し,採択された.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
第二年度にてに取り組んだ研究成果をさらに発展させ,追加実験を行い,目標であった音響信号処理のトップジャーナルへの投稿が達成された.一度目の査読結果では査読者からも好印象であったため採択の可能性が高い.そのため,大きな成果があったと言える.現在最終結果待ち状態である. また,この研究から位相の符号不定性という新たな問題を提起し,簡易的ながらも成果を得られた. 初年度から取り組んでいる,振幅と位相の関連性を考慮した複素数領域での音響信号強調手法の基礎理論構築については,学会投稿までは進んでいないものの,簡易実験で見込みのある結果が出ており,次年度への目処が立っている.
|
Strategy for Future Research Activity |
2023年度は特に,振幅と位相の関連性を考慮した複素数領域での音響信号強調手法の基礎理論構築について中心的に取り組み,まとまった結果が出次第,国内外の学会への投稿を目指す.具体的には国内ならば日本音響学会・電子情報通信学会,国外ならばICASSPやAPSIPAなどの著名な査読付き学会である.その後査読付き英語学術論文誌への投稿を目指す.本理論は応用分野が多いことが予想されるため,様々な信号処理への展開が期待できる. また,本課題とは異なるプロジェクトでの成果が,本課題の複素スペクトル領域での信号処理と関連があることが本年度わかったため,そこでの成果と合わせ,英語論文誌への採択を目指す. 進捗状況で記述した位相復元における新たな問題提起に関しても研究を発展させ,英語論文誌への投稿を目指す
|
Report
(3 results)
Research Products
(8 results)