2013 Fiscal Year Research-status Report
話者性再現度の自動評価に基づいた個性豊かな音声合成に関する研究
Project/Area Number |
24500223
|
Research Institution | Ritsumeikan University |
Principal Investigator |
山下 洋一 立命館大学, 情報理工学部, 教授 (80174689)
|
Keywords | 声質 / 個人性 / 韻律 / パラ言語情報 / 感情 |
Research Abstract |
個性豊かな音声合成を実現するために,音声における韻律情報に関する個人性知覚の分析を行った。 音声の個人性はスペクトルで表現される声質に限らず,基本周波数などの韻律情報にも表れると考えられる。そこで音声の音韻性の変化を取り除き,韻律情報を保存した合成音声を作成して,この合成音声を聴取し個人を同定する聴取実験を行った。合成音声の聴取によって韻律情報から個人を同定することは困難であったが,よく知っている身近な話者については同定できることがわかった。また,アナウンサーのニュース読み上げ音声に関しては,多くの被験者がアナウンサーであることを同定できていた。 アナウンサーと一般人話者の合成音声を対比較し識別する聴取実験を行った。多くの被験者がアナウンサーと一般人話者を識別できており,アナウンサーのニュース読み上げ音声には,なんらかの特徴があることが示唆された。音声を分析した結果から,アナウンサーの韻律特徴は一般人話者の読み上げ音声に比べて抑揚が大きくなっており,アナウンサー音声の特徴の一つであることがわかった。しかし,アナウンサーの音声を真似て一般人話者が発声した物真似音声に関しても,一部の話者においてはアナウンサーと同程度の抑揚の変化が見られるものの,アナウンサー音声と物真似音声の判別ができていることから,抑揚以外にもアナウンサーらしさを特徴づける特徴があると考えられる。 聴取実験の結果からアナウンサーらしさを求め,抑揚と話速を変数としてアナウンサーらしさを予測する重回帰モデルを作成し,評価を行った。特異な傾向を示した1名の話者を除外してモデルを学習することによって,実験で得られたアナウンサーらしさと予測値の間で0.36 の相関係数を得た。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
音声データの収録,韻律に関する個人性知覚の聴取実験を行い,韻律によってどの程度個人が同定できるかを明らかにした。個性豊かな音声合成を実現するための知見が得られ,研究が順調に進められていると考えている。
|
Strategy for Future Research Activity |
音声は,言語情報だけでなく,意図・態度・感情などのパラ言語情報も伝える。音声における個性は,声質だけでなくパラ言語情報にも現れると考えられることから,パラ言語情報における多様性に焦点をあてて研究を進めたい。 具体的には,アニメやTVゲームなどを含めて多様な韻律の音声を収集し,聴取実験から得られる印象としての多様性と,音声を分析して得られる特徴パラメータにおける多様性との関係を明らかにすることを検討する。
|
Expenditure Plans for the Next FY Research Funding |
参加を予定していた国際会議への参加を見送ったため旅費に未使用額が生じた。また,聴取実験の被験者数を減らしたために,見込んでいた謝金の支出額が減額された。 2014年度にもパラ言語情報の多様性を判断する聴取実験を行い,聴取実験の被験者および実験補助者に謝金として,20万円を見込んでいる。研究成果の発表および資料収集のために旅費として30万円,データ処理のためのソフトウェアの購入に20万円,聴取実験実施およびデータ整理用のためのPCとして30万円,プリンタトナーやプリンタ用紙などの消耗品代として10 万円,論文掲載料などのその他経費として10万円を予定している。
|
Research Products
(5 results)