研究課題
(1)センシング・解析レイヤー:2021年度までに提案した事前分布仮定型IDLMAに関し、そのパラメータも深層学習で推論する経験ベイズスキームを実データによって評価した。またそれを教師有りモデルと教師無しモデルの混合で表現する半教師有り(Product of Priors: PoP)型IDLMAへ拡張し、定量的な評価を行った。(2)時空間情報再構成レイヤー:無数の拡散性音源・雑音が存在する場合を考慮するため、フルランク空間モデル推定問題を拡張した。特に2021年度までに提案したILRMAで求められた雑音ランク1空間モデルをフルランクへ拡張する理論に関し、従来のMajorization-Equalization (ME) アルゴリズムにおいては単変量の場合しか検討されていないため、これを多変量(ベクトル変数)版へ拡張した。またその有効性を実データを用いて確認した。(3)ユーザインターフェイスレイヤー:本レイヤーの最終出力となる立体音響拡張現実感に関しては、カーネルリッジ回帰などを用いた音場の推定・補間理論を導入し、受聴者が任意の位置で所望の音像を得られる理論の検討を行い、シミュレーションによって有効性を検証した。以上の全てのレイヤーについて目標を既に達成している。また当初の研究計画以上の理論的貢献として、教師有りと教師無し音源モデルを融合したILRMA、世界で初の多変量MEアルゴリズムの発見、言語モデル先読みを導入したインクリメンタルな音声合成処理、などが挙げられる。これらの成果は学術的にも高く評価されており、複数の論文賞や奨励賞を受賞した。
令和4年度が最終年度であるため、記入しない。
すべて 2023 2022
すべて 雑誌論文 (3件) (うち査読あり 2件、 オープンアクセス 2件) 学会発表 (15件) (うち国際学会 7件、 招待講演 3件)
Journal of Signal Processing
巻: vol. 27 ページ: 1-6
10.2299/jsp.27.1
EURASIP Journal on Advances in Signal Processing
巻: 88(2022) ページ: 24pages
10.1186/s13634-022-00905-z
IEEE/ACM Transactions on Audio, Speech, and Language Processing
巻: vol. 30 ページ: 2944-2954
10.1109/TASLP.2022.3201368