2022 Fiscal Year Research-status Report
音響信号の振幅位相関係を考慮した複素スペクトル領域音声強調と応用
Project/Area Number |
20K19827
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
若林 佑幸 豊橋技術科学大学, 工学(系)研究科(研究院), 助教 (80826462)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 複素スペクトル / 位相スぺクトル / 位相復元 / 符号不定性 |
Outline of Annual Research Achievements |
本研究の目的は,音響信号の周波数解析によって得られる振幅スペクトルと位相スペクトルの関連性を考慮した音響信号強調手法の基礎理論構築とその他の音響信号処理への応用である. 従来の研究では,音響信号の時間周波数解析に基づき,振幅・位相という二つのスペクトルの挙動を利用して各種信号処理の理論・アルゴリズムの構築がなされる.本研究ではこれら二つのスペクトルに深い関連があることに着目した信号処理の理論構築と実験を行うものである. 第三年度では,第二年度で行った時間・周波数領域における振幅と位相の統計的挙動の関係性を深層学習に応用させた取り組みを発展させた.本取り組みでは,深層学習と典型的な最適化手法とを組み合わせることで,最新の従来研究よりも振幅スペクトを利用した位相スペクトルの推定性能が改善することを客観指標と被験者を募って行った聴取実験の両結果から確認し,国内会議(日本音響学会秋季研究発表会)にて発表した.さらに,この結果をまとめ,音響信号処理のトップジャーナルであるIEEE Trans. ASLPに投稿し,査読中である. また,深層学習への応用という点において,別の観点からの研究を展開させた.具体的には,位相スペクトルの符号不確定性という問題に新たに着目し,定式化を行うことで,深層学習に適用し解決を行った.不確定性問題を深層学習の学習に取り込むことで,位相スペクトルの推定性能に改善が見られ,この問題提起が有用であることを示した.この結果は国際学会APSIPAへ投稿し,採択された.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
第二年度にてに取り組んだ研究成果をさらに発展させ,追加実験を行い,目標であった音響信号処理のトップジャーナルへの投稿が達成された.一度目の査読結果では査読者からも好印象であったため採択の可能性が高い.そのため,大きな成果があったと言える.現在最終結果待ち状態である. また,この研究から位相の符号不定性という新たな問題を提起し,簡易的ながらも成果を得られた. 初年度から取り組んでいる,振幅と位相の関連性を考慮した複素数領域での音響信号強調手法の基礎理論構築については,学会投稿までは進んでいないものの,簡易実験で見込みのある結果が出ており,次年度への目処が立っている.
|
Strategy for Future Research Activity |
2023年度は特に,振幅と位相の関連性を考慮した複素数領域での音響信号強調手法の基礎理論構築について中心的に取り組み,まとまった結果が出次第,国内外の学会への投稿を目指す.具体的には国内ならば日本音響学会・電子情報通信学会,国外ならばICASSPやAPSIPAなどの著名な査読付き学会である.その後査読付き英語学術論文誌への投稿を目指す.本理論は応用分野が多いことが予想されるため,様々な信号処理への展開が期待できる. また,本課題とは異なるプロジェクトでの成果が,本課題の複素スペクトル領域での信号処理と関連があることが本年度わかったため,そこでの成果と合わせ,英語論文誌への採択を目指す. 進捗状況で記述した位相復元における新たな問題提起に関しても研究を発展させ,英語論文誌への投稿を目指す
|
Causes of Carryover |
2022年度では国内の学会は参加できるようになったものの,国外の学会においては,2020,2021年度と同様にcovid19の影響で出入国に制約があり,参加のための旅費が全く使用できなかったため,使用額に差が生じた. 2023年度では制約が撤廃されたため,国外学会参加への利用を想定している.
|
Research Products
(3 results)