自然な環境で発話された自由会話音声の発話速度モデリング
Project/Area Number |
13750373
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
System engineering
|
Research Institution | Hokkaido University |
Principal Investigator |
広重 真人 北海道大学, 大学院・工学研究科, 助手 (00241357)
|
Project Period (FY) |
2001 – 2002
|
Project Status |
Completed (Fiscal Year 2002)
|
Budget Amount *help |
¥1,800,000 (Direct Cost: ¥1,800,000)
Fiscal Year 2002: ¥700,000 (Direct Cost: ¥700,000)
Fiscal Year 2001: ¥1,100,000 (Direct Cost: ¥1,100,000)
|
Keywords | 音声 / 韻律情報 / 発話速度 / モデリング / 自由会話 / 可変閾値 |
Research Abstract |
豊富な発話速度変化を含む自発的な自由会話をヘッドセットマイクロホンにより多数収録し、本研究で提案する発話速度変化知覚モデルを適用して発話速度変化検出実験を行った。収録した自由会話音声はHMMにより音素境界を自動割り付けし、さらに目視により修正して音素境界の精度を確保した。音素境界を付与された音声サンプルについて、モーラ種ごとの伸縮傾向から求めたモーラ数換算値を用いて、モーラ種に依存しない発話速度変化曲線を求めた。この目視確認作業を経た発話速度変化曲線を発話速度変化知覚モデル適用時のリファレンスとして用いた。可変閾値による発話速度変化知覚モデルを新たに提案し、聞き手の知覚の観点から発話速度変化の検出を試みた。このモデルは話者の話速制御の容易さの観点から発話速度低下のみを検出対象とし、聞き手の発話速度に対する慣れを仮定して検出閾値を動的に変化させ発話速度低下箇所を検出するものである。閾値をゆっくりと変化させることにより、軽微な発話速度の揺らぎを無視し、話者の意図表現と関係する可能性の高い大きな発話速度変化のみを検出することができる。この知覚モデルの適用により検出された発話速度変化箇所の妥当性を確認するため、複数の被験者による発話速度変化の主観聴取実験を行い、人間の知覚と本研究の知覚モデルによる検出結果がほぼ一致することを確認した。以上の研究成果について日本音響学会英文論文誌(Letter、査読有、2003年5月掲載予定)、音声言語関連の国際学会(Eurospeech2001、2001年9月、査読有、ICSLP2002、2002年9月、査読有)および日本音響学会2001年秋季研究発表会(2001年10月)、2002年春期研究発表会(2002年3月)にて発表した。
|
Report
(2 results)
Research Products
(1 results)