2010 Fiscal Year Annual Research Report
動的な話者適応性を考慮した統一的な音声知覚モデルの研究
Project/Area Number |
21700282
|
Research Institution | Tohoku Institute of Technology |
Principal Investigator |
伊藤 仁 東北工業大学, 工学部・知能エレクトロニクス学科, 講師 (00436164)
|
Keywords | 音声知覚 / フォルマント / 母音 / 話者適応 / 正弦波モデル |
Research Abstract |
本年度は研究実施計画に沿って、話者適応性に関する予備実験を行った。まず成人男女632名が発話した音声データを音響分析し、平均的な12名を選択した。これらの話者の日本語5母音を用いて、AB-X法による話者知覚実験を行った(3000刺激×被験者4名)。その結果、話者の個人性は音韻が異なる場合でも85.9%の正答率で知覚できることが分かった。またこの中で、第1フォルマント周波数が遠い音韻では正答率が低くなるが、第2フォルマント周波数にはこの様な傾向は見出されなかった。この結果は、個人性の知覚がフォルマント周波数の近さだけでは説明できないこと、また第2フォルマント周波数より低い周波数領域が個人性知覚において重要であることを示唆するものである。この予備実験の結果を踏まえて、話者の個人性が時間変化する刺激を用いた知覚実験を実施するためには、特に時間変化する音声パラメータの適切な範囲を決定する必要がある。そこで実施計画にある通り、この範囲決定のツールとして両腕の運動情報に基づく音声合成システムを開発した。これは両腕に装着した3次元位置センサー情報を用いて、合成音声の音量、音高、音韻を制御するシステムであり、実装したシステムを用いて童謡など単純な歌唱音声が合成できることを確認した。このツールは、合成音声のパラメータ決定だけでなく、電子楽器のひとつとしても有効性の高いものであると考えられる。さらに、これらの研究の基礎である正弦波モデルを用いた音声分析手法についても改良を継続し、本年度はその成果を学術論文として発表した。これは従来難しかった時間変化する音声信号を高い精度で分析できる点に特徴があり、今後幅広い分野への応用が期待できる。
|
Research Products
(4 results)