研究分担者 |
匂坂 芳典 (株)ATR自動翻訳電話研究所, 主任
佐藤 泰雄 富士通(株), 複合第一技術部, 調査役
森川 博由 東京大学, 工学部, 助手 (40011217)
藤崎 博也 東京大学, 工学部, 教授 (80010776)
今泉 敏 東京大学, 医学部, 助教授 (80122018)
|
研究概要 |
音声言語によるマン・マシン・インターフェイスの高度化に必須な, 自然性の高い文音声を規則合成する技術を開発するために主として以下の4項目を研究した. 1)与えられた文章から音声合成に必要な各種言語情報を決定するための言語処理手法の確立. 2)種々の声質の合成を可能とするための有効な音源信号生成モデルの確立. 3)発話速度の速い会話調の音声を考慮した自然なフォルマント軌跡を合成する規則の確立. 4)文章の統語情報, 意味情報, 談話情報をもとに, 自然な韻律パタンを合成する規則の確立. まず, 1)と4)については,対象を天気予報(全国の天気概況)に限定して, 漢字かな混じり文から語彙・統語・意味・談話構造に関する言語学的情報を抽出する言語処理システと, 抽出された言語情報から音声記号と韻律記号を導出する音韻処理システムの一部を構成した. また特に4)に関しては, 談話における焦点の有無につよるアクセントの変化も規則化し, さきに提案した基本周波数パタン生成モデルに組み込んで, その有効性を確認した. 現在さらに, 対象の拡大とシステムの一般化を進めている. 次に, 2)に関しては, 種々の条件下で音声波形と唇に於ける体積速度波形等を測定して逆フィルタ法で声門体積速度波形を求めるシステムを作成し, 男女声の差異の一部を明らかにした. 実測結果とモデルによるシュミレートの結果を比較検討し, 合成音声の品質を左右する主要因を明らかにする作業を進めている. さらに, 3)に関しては, 話者と発話速度を変動要因とした場合の, 有声破裂子音に挟まれた母音のフォルマント軌跡の変化を解析し, フォルマント軌跡の変化が各単音の生成過程の動特性に存在すること, 話者によって発話速度を上げる方法に差異があることなどを明らかにした. これらの特徴を考慮してフォルマント軌跡の合成規則の開発を進めている. 以上の研究を総合して, テキストー音声変換システムの基本的構想を検討した.
|