研究課題
東京オリンピック・パラリンピックが近づくにつれ、海外からの観光客との言葉の壁はますます深刻な問題となっている。現在の音声認識・音声翻訳技術は、リソースが大きい言語についてはすでに容易に利用できるため、ここでは言語特有の知識も書き起こしデータもないようなゼロ資源の音声処理の問題を対象とする。2018 年度では、インドネシア言語のゼロリソースモデリングの構築に成功した。今回は、Dirichlet プロセスのガウス混合モデルを利用する代わりに、ディープラーニングに基づいてシステムを構築した。このシステムでは、(1)サブワード単位を発見すること、(2)音声を合成すること、および両方とも教師なしで行うことができた。また、2019年の世界ゼロ資源スピーチチャレンジに参加し、提案手法で上位結果を得ることができた。さらに、脳解析研究について、2018年度では、Speech-Imagination中のEEG振動とあからさまな相手の音声包絡線との間の同期を明らかにするための研究を行った。2019年では引き続き2020年のWorld Zero Resource Speech Challengeに参加し、システムのパフォーマンスを向上させることができた。また、テキストを書き起こさずに、未知の言語用の教師なし音声音声変換を作成し、IEEE自動音声認識および理解会議で公開した。また、すべての言語、すべての人々、すべての国の言語テクノロジーをサポートする世界言語言語コンソーシアムのため、ユネスコとの協力関係を構築した。このプロジェクトは、今後、2022年から2023年の10年間、国連国際先住民族言語年として継続される予定である。
すべて 2020 2019 2018
すべて 雑誌論文 (7件) (うち国際共著 5件、 査読あり 7件、 オープンアクセス 3件) 学会発表 (18件) (うち国際学会 15件) 産業財産権 (1件)
IEEE/ACM Transactions on Audio, Speech and Language Processing
巻: Vol.28 ページ: 976-989
10.1109/TASLP.2020.2977776
IEICE
巻: Vol.E103-D, No.03 ページ: 674-683
10.1587/transinf.2019EDP7065
巻: Volume E103.D Issue 2 ページ: 435-449
10.1587/transinf.2019EDP7040
IEEE Access
巻: Volume: 7 ページ: 79758-79769
10.1109/ACCESS.2019.2922617
巻: Volume: 27, Issue: 4 ページ: 866-877
10.1109/TASLP.2019.2900910
Neuroscience Research
巻: Volume 153 ページ: 48-55
10.1016/j.neures.2019.04.004
IEICE Transactions on Information and Systems
巻: Volume E102.D, issue 2 ページ: 383-391
10.1587/transinf.2018EDP7293