研究課題
挑戦的研究(開拓)
本研究ではリアル音声データセットに近いデータセットそのものを「生成」するメタ機械学習法の実現に取り組む。 具体的には、(1)個人のプライバシー保護が適切になされ、(2)データバイアスと公平性も改善され、(3)リアル音声データセットに近い有用性も有する大規模音声データセットを生成する方法を探求し、評価する。具体的には、音声データセットのエンコーダ・デコーダモデル、音声の話者性に加え、センシティブな属性(発話内容、アクセント、年齢、性別等)に対してもプライバシー保護を行う手法、そして生成データセットの有用性を測る代表的利用タスク(音声認識・話者認識・性別認識等)における公平性に関して研究を行う。