2001 Fiscal Year Annual Research Report
Project/Area Number |
11650425
|
Research Institution | Wakayama University |
Principal Investigator |
河原 英紀 和歌山大学, システム工学部, 教授 (40294300)
|
Keywords | 基本周波数 / 群遅延 / 運動制御の一般理論 / 高品質音声分析法 / 高品質音声合成法 / 知覚・生成相互作用 / 不動 / 能動的制御モデル |
Research Abstract |
これまでの研究による知見と、『運動制御の一般理論』に基づいて、発声の制御における能動的な関与を組み込んだ基本周波数制御モデルを構成した。このモデルを、報告者の発明である高品質音声分析変換合成システムSTRAIGHTのアルゴリズムを利用することにより、一貫した能動的歌唱合成システムのプロトタイプとして実装することができた。この成果の一部を米国音響学会の会合において発表すると共に、より広い枠組みの下で整理し直し、情報処理学会の論文として刊行した。なお、米国音響学会における発表は、参加した専門家に強い印象を与え、2002年6月の米国音響学会会合での招待講演を依頼されるに至っている。本課題を遂行する必要に迫られて開発した音源情報の精密な分析方法(周波数領域、時間領域ならびに、非周期性)の応用に関しては、歌唱における声質の分析と合成のための制御に利用する方法の検討を進め、9月のイタリアにおける国際会議において報告した。また、高分解能・高精度の基本周波数分析方法により始めて見い出された、子音周辺において短時間に基本周波数が変動する現象について、高精度の音響的イベント分析ならびに群遅延の分析と組み合わせることによりその発生機序を解明し、EUROSPEECH2002において報告した。この現象自体は、発声における聴覚系の能動的関与によるものではないが、発生機序の解明の過程は本課題で開発した高精度の音源情報分析方法の威力を示すものであり、解明した発生機序の内容自体、科学的な貢献度の高い成果である。これらの検討を通じて、相互作用を媒介することのできる聴覚情報表現について、 『不動点』をキーワードとする一般的な原理への手がかりが得られた。
|
-
[Publications] 河原英紀, 片寄晴弘: "高品質音声分析変換合成システムSTRAIGHTを用いたスキャット生成研究の提案"情報処理学会論文誌. 43・2. 208-218 (2002)
-
[Publications] Hideki Kawahara, Osamu Fujimura, Jo Estill: "Aperiodicity extraction and control using mixed mode excitation and group delay manipulation for a high quality speech analysis, modification and synthesis system STRAIGHT"Proc.MAVEBA. (CD-ROM). (2001)
-
[Publications] Hideki Kawahara, Parham Zolfaghari: "Systematic FO glitches around vowel nasal transitions"Proc.EUROSPEECH'2001. 2459-2642 (2001)