• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

1994 Fiscal Year Annual Research Report

音声対話における音声の認識と合成に関する研究

Research Project

Project/Area Number 05241104
Research InstitutionKyoto Institute of Technology

Principal Investigator

新美 康永  京都工芸繊維大学, 工芸学部, 教授 (00026030)

Co-Investigator(Kenkyū-buntansha) 広瀬 啓吉  東京大学, 工学部, 教授 (50111472)
中川 聖一  豊橋技術科学大学, 工学部, 教授 (20115893)
北澤 茂良  静岡大学, 工学部, 教授 (00109018)
粕谷 英樹  宇都宮大学, 工学部, 教授 (20006240)
板倉 文忠  名古屋大学, 工学部, 教授 (30168299)
Keywords対話音声 / 音響分布 / 雑音抑制 / 音声合成 / 合成音の心理的評価 / 音声認識 / 未知語処理 / 対話モデル
Research Abstract

対話システムを実際に使用する際には、雑音や音声の歪みが大きな問題となる。板倉は、音響分析部において頑健な特徴量を抽出するため、帯域分割-自己相関分析法と呼ぶ方法を提案し、零交差歪みのような極端に歪んだ音声や種々の雑音を付加した音声にそれを適用し、その頑健性を示した。また対話音声では、発声速度や強度の変動が大きく、文末などで発声が不明瞭になることが多い。文法的には、書き言葉に比べて制約がかなり緩くなり、間投詞の挿入や言い直しなどの現象も多くなる。牧野は、このように曖昧さの増した音声から高精度で音素を認識する方法を検討した。中川は、緩い文法的制約のもとで、正確に音声を認識し意味の理解を行う手法を検討した。新美は音声認識の信頼度が低い場合、再入力を促したり、確認を行ったりする対話制御方式の数学的なモデル化を行った。北澤は、対話音声に含まれる非言語情報の重要性に着目し、そのためのデータベースの構築を進めているが、その際問題となるラベリングの精度について検討し、ラベリングの精度を高めるための支援システムを開発した。一方、音声対話システムの出力としては、対話の流れに沿った適切な応答文章を生成し、それを聞き手にとってわかりやすくかつ自然な韻律的特徴を有する高品質の合成音声として出力することが重要である。粕谷は、ホルマント合成方式で、重要な役割を果たす、有声音源と声道のパラメタを同時に推定するために、カルマン・フィルタ同定法とシミュレイテッド・アニーリングを用いる方法を提案した。広瀬は、対話の履歴を利用して既知の語句を省略したり、新しい情報を強調する対話らしい文の生成方式を検討した。また、対話音声の韻律的特徴を調べ、対話音声用の韻律規則を構築し、対話音声の合成を行った。

  • Research Products

    (6 results)

All Other

All Publications (6 results)

  • [Publications] S.Kajita: "Speech analysis and speech recognition using subband-autocorrelation analysis" J.Acoust.Soc.Jpn.(E). 15(5). 329-338 (1994)

  • [Publications] 石塚正明: "音声合成用全零型有声音源モデル" 音響学会誌. 50. 361-368 (1994)

  • [Publications] S.Kitazawa: "Tempo estimation by wave envelope for recognition of paralinguistic features in spontaneous speech" Proc.of ICSLP-94. 3. 1691-1694 (1994)

  • [Publications] Y.Tsurumi: "An unsuperivised speaker adaptation method for continuous parameter HMM by maximum a posteriori probability estimation" Proc.of ICSLP-94. 1. 431-434 (1994)

  • [Publications] K.Hirose: "Analysis and synthesis of fundamental frequency contours for the spoken dialogue in Japanese" Proc.of ESCA/IEEE Workshop on Speech Synthesis. 167-170 (1994)

  • [Publications] 牧野正三: "単語の出現確率を用いた単語認識の性能予測" 電子情報通信学会論文誌. J77-D-II. 274-281 (1994)

URL: 

Published: 1996-04-08   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi