研究課題/領域番号 |
05241104
|
研究機関 | 京都工芸繊維大学 |
研究代表者 |
新美 康永 京都工芸繊維大学, 工芸学部, 教授 (00026030)
|
研究分担者 |
広瀬 啓吉 東京大学, 工学部, 教授 (50111472)
中川 聖一 豊橋技術科学大学, 工学部, 教授 (20115893)
北澤 茂良 静岡大学, 工学部, 教授 (00109018)
粕谷 英樹 宇都宮大学, 工学部, 教授 (20006240)
板倉 文忠 名古屋大学, 工学部, 教授 (30168299)
|
キーワード | 対話音声 / 音響分布 / 雑音抑制 / 音声合成 / 合成音の心理的評価 / 音声認識 / 未知語処理 / 対話モデル |
研究概要 |
対話システムを実際に使用する際には、雑音や音声の歪みが大きな問題となる。板倉は、音響分析部において頑健な特徴量を抽出するため、帯域分割-自己相関分析法と呼ぶ方法を提案し、零交差歪みのような極端に歪んだ音声や種々の雑音を付加した音声にそれを適用し、その頑健性を示した。また対話音声では、発声速度や強度の変動が大きく、文末などで発声が不明瞭になることが多い。文法的には、書き言葉に比べて制約がかなり緩くなり、間投詞の挿入や言い直しなどの現象も多くなる。牧野は、このように曖昧さの増した音声から高精度で音素を認識する方法を検討した。中川は、緩い文法的制約のもとで、正確に音声を認識し意味の理解を行う手法を検討した。新美は音声認識の信頼度が低い場合、再入力を促したり、確認を行ったりする対話制御方式の数学的なモデル化を行った。北澤は、対話音声に含まれる非言語情報の重要性に着目し、そのためのデータベースの構築を進めているが、その際問題となるラベリングの精度について検討し、ラベリングの精度を高めるための支援システムを開発した。一方、音声対話システムの出力としては、対話の流れに沿った適切な応答文章を生成し、それを聞き手にとってわかりやすくかつ自然な韻律的特徴を有する高品質の合成音声として出力することが重要である。粕谷は、ホルマント合成方式で、重要な役割を果たす、有声音源と声道のパラメタを同時に推定するために、カルマン・フィルタ同定法とシミュレイテッド・アニーリングを用いる方法を提案した。広瀬は、対話の履歴を利用して既知の語句を省略したり、新しい情報を強調する対話らしい文の生成方式を検討した。また、対話音声の韻律的特徴を調べ、対話音声用の韻律規則を構築し、対話音声の合成を行った。
|