研究課題
基盤研究(B)
音声生成過程の古典的なモデルであるソース・フィルタモデルに従い、音声を声帯振動による音源と、声道による調音フィルタという互いに独立な物理的構成要素に分解する前処理の実施を考える。そして、それぞれの時系列に対して自己教師あり表現学習を適用すれば、音源と調音フィルタという物理的な意味合いが明確に区別できる構成要素毎に事前学習モデルが得られると共に、下流タスクに必要な情報を保持している特徴量の取捨選択も容易になると期待できる。