2018 Fiscal Year Research-status Report
多方言音声合成のための地理情報を利用した音韻・アクセントモデリングに関する研究
Project/Area Number |
18K18100
|
Research Institution | The University of Tokyo |
Principal Investigator |
高道 慎之介 東京大学, 大学院情報理工学系研究科, 助教 (90784330)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 音声合成 / 方言 / 韻律 |
Outline of Annual Research Achievements |
(1)音声・雑音生成過程の同時推定に基づく高品質音声合成アルゴリズム:一般家庭の収録音声を対象に,雑音生成過程と音声生成過程(音声合成)の同時推定を試みた.まず,空調音などの定常性雑音を対象に,その生成統計量を効率よく推定する敵対的学習アルゴリズムに基づく雑音生成モデルを導入した.本研究成果は,国際会議APSIPAで発表した.
(2) 地理情報を利用した多方言音韻・アクセントモデリング: 音声合成を行うためには,入力テキストの言語情報と,出力音声の音韻・アクセント情報を対応付ける必要がある.日本共通語の場合,各単語とその音韻・アクセント情報を対応付ける辞書データが豊富に存在するため,音声合成が可能となる.しかしながら,日本語方言の場合,そのような辞書データが存在するケースはまれである.また,日本共通語に登場しない方言独自の未知語が存在する.これらの問題に対して,phoneme-/prosody-aware subword embedding に基づく教師無し方言音韻・アクセント推定アルゴリズムを提案した.subwordとは,近年,深層学習に基づく機械翻訳の分野で提案された技術であり,単語と文字の中間的な分割区分により未知語を減少させる枠組みである.このアイディアを方言音声合成に導入し,subwordから音韻・アクセント情報を推定する統計モデルについて研究した.また,複数方言の情報を一括でモデリングするため,方言地理情報からその音韻・アクセントを回帰的に推定する統計モデルを提案した.本研究成果は,国際会議APSIPAで発表した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
計画書通り進行している.
|
Strategy for Future Research Activity |
本年度は,日本語方言の知見を活かした音声合成法を提案した.今後は,汎用性を高めるために,知見を利用しない音声合成法を研究する.
|
Causes of Carryover |
今年度中に予定していた国際会議発表を次年度に変更したため,使用額に変更が生じた.差額は,次年度中に旅費に利用する.
|
Research Products
(2 results)