Research Abstract |
本テーマの究極の目標は,聴取者(音声研究者ではない一般市民を想定)が聞き取って記憶している特定の発話者の「音声言語の総体」を,音声合成の手法を用いて近似よく再現する「音声モンタージュシステム」の実現にある.助成期間では,6つの部分課題について研究を進め,声質の再現に重点を置いた実証的なシステムを構築することを目的とする.以下に,部分課題((1)〜(6))について,今年度の研究実績を述べる. (1)言語表出の研究 より詳細な音声の再現方法を検討するため,声質以外の表現語について,了解性などの調査を行った. (2)表現語の音響関連量の研究 音声サンプルを追加収集するとともに,合成の難しい「声年齢」について音響関連量をより詳細に抽出した.(3)発話音声の記憶に関する研究 (3)発話音声の記憶に関する研究 これまでの知見をまとめ,記憶音声と実際の音声の音響関連量の差異を求めた. (4)音声の呈示手法に関する研究 一方的に音声を呈示する手法と聴取者自身で調整する手法の有効性を調べた. (5)合成音声の類似度評定の研究 個人性保持に重きを置いた類似度評定の予備実験を行った. (6)柔軟な音声合成技術に関する研究 直感的な操作で,ARX分析合成を容易に行えるGUIを作成した. 今年度は,これまでの部分課題の成果を統合し,実証的な(声質)音声モンタージュシステムを構築した.その結果から,記憶音声と実際の音声では,基本周波数などの差異は小さいことが示された.よって,声質の再現は可能であると考えられる.しかし,声質だけでは記憶音声の再現に限界があり,また,人間の聴取印象は発話様式の影響が大きい傾向が見られた.部分課題(1)(言語表出の研究)について,発話様式や聴取者の嗜好などの音声の表現について,さらに研究を進める必要がある. なお,助成で行った実験について,まだ未公表の知見が残っており,引き続き,検討を深めた上で公表していきたい.
|