研究課題/領域番号 |
17K12718
|
研究機関 | 早稲田大学 |
研究代表者 |
俵 直弘 早稲田大学, 理工学術院, 講師(任期付き) (50726255)
|
研究期間 (年度) |
2017-04-01 – 2019-03-31
|
キーワード | 話者適応 / 低資源言語 / 深層学習 / 音響特徴抽出 |
研究実績の概要 |
本研究は,系列データから特徴的なパターン(セグメント)を発見し分類する枠組みを構築することで,事前知識が存在しない未知のデータ集合の中からクラス概念を自動的に発見・獲得できる機構の実現を目指す.この目的を実現するため(WP1)セグメント内変動に頑健なセグメント表現(Embedding)法の開発,(WP2)セグメント表現とクラスタリングの同時最適化(Joint Optimization)法の開発,(WP3)再セグメンテーション(Resegmentation)法の開発,(WP4)系列データクラスタリング問題への適用を目指す.平成29年度はそのうち,(WP1)と(WP2)に焦点を当てて研究を行った. (WP1)では,まず,書き起こしが存在しない低資源言語における音素獲得問題を対象として,未知言語の音響データにおける識別的な特徴抽出法の開発を行った.このとき,音素獲得を行うためには特に話者の違いによる変動が問題となることを明らかにして,複数の既知言語で構築した話者変動抑圧法を未知言語に適用した際の性能を評価した.更に未知言語にも適用可能な新たな話者変動抑圧法として,敵対的学習に基づく話者変動抑圧法を開発した.また,これら技術を開発する中で,音韻性だけでなく話者性も同様の枠組みで抽出できることを明らかにした. (WP2)では,深層学習を用いてクラスタリングを行う手法の検討を行った.具体的には,可変長のセグメントを固定次元の潜在特徴空間へ射影するネットワークを定義し,潜在表現空間でできるだけコンパクトな表現が得られるようにネットワークを最適化することでクラスタリングを行う方式の適用可能性を検討した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
実施計画においては,平成29年度は(WP1)セグメント内変動に頑健なセグメント表現法の開発と(WP2)セグメント表現とクラスタリングの同時最適化法の開発を目指す計画であった. (WP1)においては,低資源音素獲得問題を対象とした特徴抽出器の開発を行う中で,話者性と音韻性のように異なる複数の変動成分が含まれるデータを対象としてクラス獲得を行う場合,従来の音素識別器に基づく特徴抽出器ではこれら変動を区別できず意味のないクラスが大量に発生することを明らかにした.同様の問題は一般的な既知ドメインの特徴抽出問題でも生じるが,クラスラベルが利用できない未知ドメインデータではこの問題がより顕著であることが明らかになった.そこで,本年度は特に複数の変動成分を含むデータから特定の変動のみを抽出できる特徴抽出法の開発に注力し,敵対的学習を用いた深層学習を導入することで実現できることを示した. (WP2)においては,適用を検討した深層学習を用いるクラスタリング手法をそのまま適用した場合(WP1)で示した複数の変動成分の影響が大きくそのままでは適用できないことが明らかになった.しかしながら(WP1)で開発した変動成分を抑える枠組みを併用することでこの問題を回避できる見込みを得た.
このように各項目において研究の変更は発生したが,未知のドメインにおける特徴抽出について課題と解決策の抽出ができたという点で進捗状況は概ね実施計画通りに進展していると言える.
|
今後の研究の推進方策 |
平成30年度は,引き続き(WP2)セグメント表現とクラスタリングの同時最適化法の開発を行う.特に今年度実現した特定の変動成分を強調する枠組みと統合することで実現を目指す.また,並行して(WP3)クラスタリングとセグメンテーションを同時に行う手法の開発を行い,低資源言語におけるクラス獲得法の開発を継続する予定である. また,本研究で実現を目指すクラス獲得の枠組みは,音声以外の系列データを対象とすることができる.そこで音声を対象とした場合と並行して,(WP4)として動画像を用いた表情認識問題に本手法を適用することを検討している.具体的には,提案手法で獲得された特徴的な顔画像セグメントを用いることで,顔表情認識コーパス作成のためのラベリング支援ツールを開発する予定である.
|
次年度使用額が生じた理由 |
旅費については他業務との兼ね合いで参加を予定していた国際学会に参加できなかったためによる.また英語論文についての校正費は今年度末までに投稿準備が完了しなかったため計上しなかった. 更に物品費に関しては当初購入を予定していた計算機よりも高性能な製品が必要となったため,次年度と合わせて使用することにした. 次年度は,計算機設備の拡充のため平成30年度使用額と合わせて高性能計算機およびGPUの購入に充てる.また,研究の進捗に応じ新たなデータコーパスの購入が見込まれるため,その購入費にあてる.
|