研究課題
現在音声認識や音声合成などにおいて高い性能を得るためには、多大な手間と費用が必要となる教師あり学習やシステムチューニングが必要とされている。本研究ではこれらのシステム開発における自動化を目的に、人手の介入の必要度を下げるための取り組みを行った。ニューラルネットワークにおいてニューロンの結合重みはバックプロパゲーションにより推定されるが、学習時にはそれ以外にネットワークの構造や各種学習条件を最適化する必要がある。本研究では進化戦略やベイズ法などのブラックボックス最適化手法を応用し、並列計算を行うことで、大規模な音声認識システムや翻訳システムのチューニングの自動最適化に有効であることを示した。またそれにより構築した音声認識システムをもとに、言語によらず音声識別性能の高い音声特徴量の作成手法を提案し、有効性を示した。これは低リソース言語における教師なし学習において有用となるものである。音声合成においては、一般に人が聞いて自然な音声が合成されるように目的関数を設計するのが難しい問題がある。その解決法として、目的関数自身をシステムに学習させる敵対的学習を利用した任意話者声質変換システムの改良を検討した。音声認識システム等においては、特定のタスクに対して一度高精度なシステムを構築したとしても、同じ言語の異なるタスクに用いようとすると認識性能が大きく劣化してしまう問題がある。この問題に対応するため、認識対象タスクの書き起こしラベルの無い音声データを用いた教師なし適応手法や、クラウド環境における多数のユーザーからの僅かなフィードバックをもとにシステム性能を向上させる手法を提案し、有効性を示した。
29年度が最終年度であるため、記入しない。
すべて 2018 2017 その他
すべて 国際共同研究 (1件) 雑誌論文 (15件) (うち国際共著 5件、 査読あり 6件、 オープンアクセス 2件) 学会発表 (15件) (うち国際学会 6件)
Proc. IEEE ICASSP
巻: - ページ: 5759~5763
日本音響学会2018年春季研究発表会講演論文集
巻: - ページ: 15~16
巻: - ページ: 123~124
巻: - ページ: 125~126
巻: - ページ: 345~346
Proc. IEEE ASRU
巻: - ページ: 747-753
Proc. International Workshop on Spoken Language Translation (IWSLT)
巻: - ページ: 120~128
Proc. Dialog System Technology Challenges (DSTC6)
巻: - ページ: 1~5
情報処理学会研究報告
巻: Vol.2017-SLP-119 ページ: 1~4
巻: Vol.2017-SLP-118 ページ: 1~4
巻: Vol.2017-SLP-118 ページ: 1~5
Proc. Interspeech
巻: - ページ: 2546~2550
日本音響学会2017年秋季研究発表会講演論文集
巻: - ページ: 1~2
巻: - ページ: 1397~1398
Proceeding of the Thirteenth International Conference on Intelligent Information Hiding and Multimedia Signal Processing
巻: - ページ: 97~103