研究課題/領域番号 |
21K21305
|
研究種目 |
研究活動スタート支援
|
配分区分 | 基金 |
審査区分 |
1002:人間情報学、応用情報学およびその関連分野
|
研究機関 | 東京大学 |
研究代表者 |
齋藤 佑樹 東京大学, 大学院情報理工学系研究科, 助教 (20907901)
|
研究期間 (年度) |
2021-08-30 – 2023-03-31
|
キーワード | 音声合成 / 深層学習 / Continual Learning |
研究成果の概要 |
本研究では,継続的に学習可能な音声合成の基盤構築を目的とする.この遂行のために,(1)単一話者のテキスト読み上げドメインにおける音声合成のcontinual learningの基礎検討,(2)(1)を多話者音声合成に拡張するための学習アルゴリズムの設計・評価,(3)(1)を対話音声合成に拡張するための学習アルゴリズムおよびニューラルネットワーク構造の設計・評価,(4)(3)を多ドメイン対話音声合成に拡張するためのデータベース整備を実施した.
|
自由記述の分野 |
知能情報学
|
研究成果の学術的意義や社会的意義 |
人間は過去の経験に関連付けることで新たな知識を逐次的・効率的に学習できるが,現状の音声合成は与えられた音声データの高精度な再現を目的とした学習を1度行うのみであり,それにより得られた知識を保持しつつ,新たな環境に適応するための機構を有さない.そこで本研究では,AI が継続的・階層的・追加的に知識を学習するための枠組みである Continual Learning に基づく音声合成の学習法を提案し,既知のデータに対する再現精度を保持しつつ,追加で与えられるデータに対する予測性能も改善可能な音声合成理論を新たに構築した.
|