研究課題/領域番号 |
09480061
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 東京大学 |
研究代表者 |
広瀬 啓吉 東京大学, 大学院・新領域創成科学研究科, 教授 (50111472)
|
研究分担者 |
峯松 信明 豊橋技術科学大学, 工学部, 助手 (90273333)
|
研究期間 (年度) |
1997 – 1999
|
キーワード | 韻律的特徴 / 音声合成 / 音声認識 / 対話調音声 / 感情音声 / モーラ遷移確率モデル / アクセント句境界 / 動的枝刈り |
研究概要 |
音声の韻律的特徴と言語情報やパラ・非言語情報との関係を定式・体系化した上で、音声合成と音声認識の高度化を実現することを目的とし、以下を含む成果を達成した。 1.基本周波数パターンを時間波形とみなしてフィルタ操作、微分操作等を施すことによりアクセント成分を低減し、フレーズ指令の良好な推定を実現した。さらに、音声データの韻律自動ラベリングを目的として、言語情報から得られる知見を利用して推定精度を向上させる手法を開発した。 2.対話調音声合成のためのモーラ持続時間制御規則を作成した。これは、朗読調音声の各モーラの持続時間を基本周波数パターンによって定義された韻律句毎に対話音声のそれに変更することを基本とする。 3.態度・感情を付与した音声の韻律的特徴を分析し、話者は感情を表現するための幾つかのcueを程度によて適宜使い分けていることを示した。また、感情の付与には分節的特徴も重要なことを知覚実験により示た。 4.アクセント句の基本周波数パターンをモーラ単位でコード化し、その遷移を確率モデル(モーラ遷移確率モデル)によって表現する手法を開発し、アクセント句境界を70%〜75%の精度(挿入誤り率11%〜15%)で検出した。これを語彙制約のない連続音声認識に利用し、数%のモーラ認識率の向上を確認した。またアクセント型、フレーズ境界位置を入カとして基本周波数パターンを合成する手法を開発した。 5.韻律境界情報を用いて大語彙連続音声認識のビーム探索枝刈りを動的に行う手法を開発し、認識率の低下なしに探索範囲を1/4程度以下にし得ることを示した。これは、韻律境界でビーム幅を拡大し、境界間で縮小するものである。さらに、韻律境界情報によって単語間文脈依存音素モデルの選択を制御する手法を開発した。 6.以上の成果を反映させ、学術情報検索をタスクとする音声対話システムを構築し、その性能評価を行った。
|