研究課題/領域番号 |
21K21305
|
研究種目 |
研究活動スタート支援
|
配分区分 | 基金 |
審査区分 |
1002:人間情報学、応用情報学およびその関連分野
|
研究機関 | 東京大学 |
研究代表者 |
齋藤 佑樹 東京大学, 大学院情報理工学系研究科, 助教 (20907901)
|
研究期間 (年度) |
2021-08-30 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
2022年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2021年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 音声合成 / 深層学習 / Continual Learning |
研究開始時の研究の概要 |
音声合成は人間とAIの音声情報伝達支援のために研究されており,機械学習に基づく音声情報処理技術の進展に伴い,高品質な音声を合成可能になりつつある.しかし,人間は過去の経験に関連付けることで新たな知識を逐次的・効率的に学習できる一方で,現状の音声合成は学習された知識を保持しつつ,新たな環境に適応するための機構を有さない.そこで本研究では,AIが継続的・階層的・追加的に知識を学習するための枠組みであるContinual Learningに基づく音声合成の学習法を提案し,既知のデータに対する再現精度を保持しつつ,追加データに対する予測性能も改善可能な理論を新たに構築する.
|
研究成果の概要 |
本研究では,継続的に学習可能な音声合成の基盤構築を目的とする.この遂行のために,(1)単一話者のテキスト読み上げドメインにおける音声合成のcontinual learningの基礎検討,(2)(1)を多話者音声合成に拡張するための学習アルゴリズムの設計・評価,(3)(1)を対話音声合成に拡張するための学習アルゴリズムおよびニューラルネットワーク構造の設計・評価,(4)(3)を多ドメイン対話音声合成に拡張するためのデータベース整備を実施した.
|
研究成果の学術的意義や社会的意義 |
人間は過去の経験に関連付けることで新たな知識を逐次的・効率的に学習できるが,現状の音声合成は与えられた音声データの高精度な再現を目的とした学習を1度行うのみであり,それにより得られた知識を保持しつつ,新たな環境に適応するための機構を有さない.そこで本研究では,AI が継続的・階層的・追加的に知識を学習するための枠組みである Continual Learning に基づく音声合成の学習法を提案し,既知のデータに対する再現精度を保持しつつ,追加で与えられるデータに対する予測性能も改善可能な音声合成理論を新たに構築した.
|