2018 Fiscal Year Annual Research Report

Knowledge acquisition from unknown domain data with segmental clustering

Research Project

Project/Area Number	17K12718
Research Institution	Waseda University
Principal Investigator	俵直弘早稲田大学, 理工学術院, 講師(任期付) (50726255)
Project Period (FY)	2017-04-01 – 2019-03-31
Keywords	話者適応 / 低資源言語音声認識 / 深層学習 / 話者特徴抽出 / 音素特徴抽出 / 音声強調 / 敵対的学習
Outline of Annual Research Achievements	本研究は，系列データから特徴的なパターンを発見し分類する枠組みを構築することで，事前知識が存在しない未知のデータ集合から所望のクラス概念を自動的に発見・獲得できる機構の実現を目指す．前年度の結果から，本目的を達成するためには所望のクラス概念の情報を抽出できる特徴抽出機構の確立が最も重要であることが明らかになったため，本年度も前年度に引き続きその確立に焦点を当てて研究を行った．まず，書き起こしが存在しない低資源言語における音素獲得問題を対象として，未知言語の音響データからその言語特有の音素識別に有効な特徴量を抽出する手法の改善を行った．前年度に提案した手法では，既知言語である英語音声の音素体系を流用し構築したモデルを用いて未知言語の特徴抽出器を構築したが，既知言語とは大きく異なる音素体系を持つ言語においては正しく動作しないことが判明した．この問題を解決するため，未知言語の音響データをクラスタリングすることで，対象言語特有の音素クラスを自動発見し，獲得した音素体系に基づいて特徴抽出器を構築する手法を新たに確立した．このとき，一般的なクラスタリング法をそのまま導入すると，音韻性と話者性とを分離することが困難であることを示した．この問題を解決するために敵対的学習を導入することで不要な情報である話者性を除去した特徴量が得られることを示した．更に本研究で得られた知見を用いて，所望の特性とそれ以外の特性とを分離することのできる新たな深層学習モデルを提案し，話者認識と音素認識タスクにおいてその有効性を示した．また，未知の環境下における音声認識を目的として，本研究で得られた敵対的学習法の知見を用いた新たな音声強調法を確立した。提案手法では敵対的学習を用いた深層学習に基づく音源強調法と従来の非学習型の音源強調法とを組み合わせることで未知の環境下でも頑健に動作する音声強調法を確立した．

Research Products
(10 results)

All 2019 2018

All Presentation (10 results) (of which Int'l Joint Research: 2 results)

[Presentation] Postfiltering Using an Adversarial Denoising Autoencoder with Noise-aware Training2019
- Author(s)
  Naohiro Tawara, Hikari Tanabe, Tetsunori Kobayashi, Masaru Fujieda, Kazuhiro Katagiri, Takashi Yazu, Tetsuji Ogawa
- Organizer
  ICASSP2019
- Int'l Joint Research
[Presentation] 敵対的デノイジングオートエンコーダを用いた拡散性雑音除去2019
- Author(s)
  田辺ひかり，俵直弘，小林哲則，藤枝大，片桐一浩，矢頭隆，小川哲司
- Organizer
  音声研究会
[Presentation] ゼロリソース言語音声認識のための発話者の違いに頑健な特徴抽出2019
- Author(s)
  樋口陽祐，俵直弘，小川哲司，小林哲則
- Organizer
  日本音響学会春季研究発表会
[Presentation] ドメイン属性情報を用いた RNN 言語モデルのドメイン汎化2019
- Author(s)
  芦川博人，森岡幹，俵直弘，小川厚徳，岩田具治，小川哲司，小林哲則
- Organizer
  日本音響学会春季研究発表会
[Presentation] 話者・音韻特徴抽出のためのディスエンタングリングニューラルネットワークの実現にむけて2019
- Author(s)
  俵直弘，小林哲則，小川哲司
- Organizer
  日本音響学会春季研究発表会
[Presentation] noise-aware 学習を用いた敵対的デノイジングオートエンコーダによるポストフィルタリング2019
- Author(s)
  俵直弘，田辺ひかり，小林哲則，藤枝大，片桐一浩，矢頭隆，小川哲司
- Organizer
  日本音響学春春季研究発表会
[Presentation] Adversarial autoencoder for reducing nonlinear distortion2018
- Author(s)
  Naohiro Tawara, Tetsunori Kobayashi, Masaru Fujieda, Kazuhiro Katagiri, Takashi Yazu, Tetsuji Ogawa
- Organizer
  APSIPA2018
- Int'l Joint Research
[Presentation] RNN言語モデルのためのドメイン属性情報を用いたゼロショット学習2018
- Author(s)
  芦川博人 , 森岡幹 , 俵直弘 , 小川厚徳 , 岩田具治 , 小川哲司 , 小林哲則
- Organizer
  音声言語情報処理研究会
[Presentation] 非線形ひずみ除去のための敵対的denoising autoencoder2018
- Author(s)
  俵直弘 , 小林哲則 , 藤枝大 , 片桐一浩 , 矢頭隆 , 小川哲司
- Organizer
  音声言語情報処理研究会
[Presentation] 敵対的デノイジングオートエンコーダによる非線形ひずみ除去フィルタリング2018
- Author(s)
  俵直弘 , 小林哲則 , 藤枝大 , 片桐一浩 , 矢頭隆 , 小川哲司
- Organizer
  日本音響学会秋季研究発表会

2018 Fiscal Year Annual Research Report

Knowledge acquisition from unknown domain data with segmental clustering

Principal Investigator

俵 直弘 早稲田大学, 理工学術院, 講師(任期付) (50726255)

Research Products

[Presentation] Postfiltering Using an Adversarial Denoising Autoencoder with Noise-aware Training2019

Author(s)

Organizer

[Presentation] 敵対的デノイジングオートエンコーダを用いた拡散性雑音除去2019

Author(s)

Organizer

[Presentation] ゼロリソース言語音声認識のための発話者の違いに頑健な特徴抽出2019

Author(s)

Organizer

[Presentation] ドメイン属性情報を用いた RNN 言語モデルのドメイン汎化2019

Author(s)

Organizer

[Presentation] 話者・音韻特徴抽出のためのディスエンタングリングニューラルネットワークの実現にむけて2019

Author(s)

Organizer

[Presentation] noise-aware 学習を用いた敵対的デノイジングオートエンコーダによるポストフィルタリング2019

Author(s)

Organizer

[Presentation] Adversarial autoencoder for reducing nonlinear distortion2018

Author(s)

Organizer

[Presentation] RNN言語モデルのためのドメイン属性情報を用いたゼロショット学習2018

Author(s)

Organizer

[Presentation] 非線形ひずみ除去のための敵対的denoising autoencoder2018

Author(s)

Organizer

[Presentation] 敵対的デノイジングオートエンコーダによる非線形ひずみ除去フィルタリング2018

Author(s)

Organizer

俵直弘早稲田大学, 理工学術院, 講師(任期付) (50726255)