2009 Fiscal Year Annual Research Report
動的な話者適応性を考慮した統一的な音声知覚モデルの研究
Project/Area Number |
21700282
|
Research Institution | Tohoku University |
Principal Investigator |
伊藤 仁 Tohoku University, 大学院・工学研究科, 助教 (00436164)
|
Keywords | 音声学 / 認知科学 |
Research Abstract |
フォルマントモデルとスペクトル全体形状モデルを包含する統一的な意声知覚モデルを構築するために,フォルマントピークとスペクトル傾きを操作した合成母音を用いて知覚実験を行った.この結果を,国際学会(Interspeech2009)と国内学会(日本音響学会2010年3月)で発表し,上述した既存の二種類のモデルでは十分に説明できない知覚現象が存在することを示した.この結果に基づいて,音声信号から知覚される音韻性を決定する計算モデルの構築を試みた.一次聴神経における音声の表現として興奮パタンを採用し,このパタンの局所的な形状を2次元のCOS展開で評価することにより,知覚実験の結果が単純なターゲットモデルで説明できる可能性があることを明らかにした.このモデルは,対立する既存の二つのモデルを矛盾なく統合できる点に価値があり,2010年3月の日本音響学会で発表した際には,多くの研究者から高い評価が得られた.また,提案モデルの弱点として指摘されていた,音声の指向特性によるスペクトル形状の変化の問題に関しては,定量的な音響測定実験を行い,少なくとも通常の発話環境では指向特性の影響は十分に小さいことを確認した.この結果は2009年9月の日本音響学会で発表している.また,提案モデルを不特定話者に拡張するために,発話時の話者の声道伝達特性を高い精度で推定する必要があり,これを実現するために正弦波モデルに基づく新たな音響分析手法を提案した.この手法は2010年3月にAcoustical Science and Technology誌に掲載された.
|
Research Products
(5 results)