2018 Fiscal Year Annual Research Report
Knowledge acquisition from unknown domain data with segmental clustering
Project/Area Number |
17K12718
|
Research Institution | Waseda University |
Principal Investigator |
俵 直弘 早稲田大学, 理工学術院, 講師(任期付) (50726255)
|
Project Period (FY) |
2017-04-01 – 2019-03-31
|
Keywords | 話者適応 / 低資源言語音声認識 / 深層学習 / 話者特徴抽出 / 音素特徴抽出 / 音声強調 / 敵対的学習 |
Outline of Annual Research Achievements |
本研究は,系列データから特徴的なパターンを発見し分類する枠組みを構築することで,事前知識が存在しない未知のデータ集合から所望のクラス概念を自動的に発見・獲得できる機構の実現を目指す.前年度の結果から,本目的を達成するためには所望のクラス概念の情報を抽出できる特徴抽出機構の確立が最も重要であることが明らかになったため,本年度も前年度に引き続きその確立に焦点を当てて研究を行った. まず,書き起こしが存在しない低資源言語における音素獲得問題を対象として,未知言語の音響データからその言語特有の音素識別に有効な特徴量を抽出する手法の改善を行った.前年度に提案した手法では,既知言語である英語音声の音素体系を流用し構築したモデルを用いて未知言語の特徴抽出器を構築したが,既知言語とは大きく異なる音素体系を持つ言語においては正しく動作しないことが判明した.この問題を解決するため,未知言語の音響データをクラスタリングすることで,対象言語特有の音素クラスを自動発見し,獲得した音素体系に基づいて特徴抽出器を構築する手法を新たに確立した.このとき,一般的なクラスタリング法をそのまま導入すると,音韻性と話者性とを分離することが困難であることを示した.この問題を解決するために敵対的学習を導入することで不要な情報である話者性を除去した特徴量が得られることを示した. 更に本研究で得られた知見を用いて,所望の特性とそれ以外の特性とを分離することのできる新たな深層学習モデルを提案し,話者認識と音素認識タスクにおいてその有効性を示した. また,未知の環境下における音声認識を目的として,本研究で得られた敵対的学習法の知見を用いた新たな音声強調法を確立した。提案手法では敵対的学習を用いた深層学習に基づく音源強調法と従来の非学習型の音源強調法とを組み合わせることで未知の環境下でも頑健に動作する音声強調法を確立した.
|