本研究は、漢字かなまじり表記された日本語の文章(文字記号列)を入力として、これを標準語で正しく発音された連続音声に変換するシステムを確立することを目的とし、以下の成果を達成した。 (1) 対象分野として天気予報文を選定し、統語・意味解析を行って、その結果を音声合成に適した形式で出力する手法を開発した。 (2) 基本周波数パタン生成過程のモデルを用いてアナウンス文音声の基本周波数パタンの特徴を定量的に分析した。特に、文の統語構造と基本周波数パタンのフレーズ成分との関係を調べた。 (3) 連続音声中のアクセント成分の特徴を調べ、単語のアクセント型文の統語構造、文章の談話構造との関係を定量的に明らかにした。 (4) 上記(1)〜(3)の成果をもとに、入力文章に表記されていない韻律記号を、句読点、単語のアクセント型、文の統語構造、文章の談話構造を利用して導出する規則を作成した。 (5) 音節蓄積パタンの品質評価を行い、改良を加えた。また、音節蓄積パタンの接続方法の改良も行った。 (6) 音節蓄積パタンとして、ARMAパラメータを利用した場合のパタン接続方法について検討するとともに、得られた合成音声の主観評価を行った。 (7) 以上の成果、及び前年度の成果をもとに、音声の分節的特徴は音節ごとに蓄積したパタンを接続して合成し、音声の韻律的特徴は基本周波数パタン生成過程のモデルを用いて規則により合成する日本語文章音声合成システムを開発した。文章音声を合成し、聴取を行って、システムの有効性を立証した。なお、本システムは、当初、天気予報文を対象として開発されたものであるが、他分野の文章に対しても有効である。 以下のように、本研究の目的・計画はほぼ達成し得た。
|