研究課題/領域番号 |
08558028
|
研究種目 |
基盤研究(A)
|
配分区分 | 補助金 |
応募区分 | 展開研究 |
研究分野 |
知能情報学
|
研究機関 | 東京大学 |
研究代表者 |
広瀬 啓吉 東京大学, 大学院・工学系研究科, 教授 (50111472)
|
研究分担者 |
小杉 康宏 東京電力株式会社, システム研究所, 主任研究職員
峯松 信明 豊橋技術科学大学, 工学部, 助手 (90273333)
大野 澄雄 東京理科大学, 基礎工学部, 助手 (80256677)
鈴木 敏克 東京電力株式会社, システム研究所, 主任(研究職)
|
研究期間 (年度) |
1996 – 1998
|
研究課題ステータス |
完了 (1998年度)
|
配分額 *注記 |
8,000千円 (直接経費: 8,000千円)
1998年度: 1,700千円 (直接経費: 1,700千円)
1997年度: 1,700千円 (直接経費: 1,700千円)
1996年度: 4,600千円 (直接経費: 4,600千円)
|
キーワード | 音声対話システム / 音声認識 / 音声合成 / 多言語システム / ビタビベイズ予測分類 / 波形編集合成 / 韻律モデル / 声調認識 / ビタビ探索 / TD-PSOLA / 対話処理 / 言語自動識別 / ベイズ予測分類 / HMM |
研究概要 |
本研究は、日本語と中国語の両言語に対応した音声対話システムを試作し、多言語音声対話システムの実用化の可能性を探ることを目的としている。以下の成果(主なもの)を挙げた。 1. 学術文献情報検索を対話システムのタスクとし、関連のデータベースを整備するとともに、音声合成用の辞書データベースを実装した。また、音声認識学習・評価用の音声データベースを作成した。 2. 収集した音声データをもとに、音素HMM、音素クラスHMMの学習を行うとともに、音素、音素クラスの系列の特徴から日本語・中国語の識別を行う手法を開発した。 3. 頑健な音声認識手法として、ビタビアルゴリズムに基づくベイズ予測分類法を提案するとともに、使用環境のデータを用いて順次により確からしい事後確率密度関数を推定する手法を開発した。また、Minimax法にビタビ探索を導入することで、連続音声への拡張が可能であることを示した。 4. 人手を介さない波形編集音声合成を開発した。これは、音声認識技術を利用して合成素片を作成し、LMAフィルタ分析によりピッチマークを自動付与することに基づく。これを利用して中国語の音声合成部を構築した。 5. 波形編集合成との切り替えが可能なフォルマント音声合成システムを完成した。これにより、従来音質の悪かった無声子音で格段の向上が得られた。 6. 中国語音声の基本周波数パターンの形状を統一的に表現する関数を定義し、それにもとづいて合成に適した中国語韻律モデルを構築した。 7. 節の声調核(母音核に対応)のみの特徴を見ることによって中国語連続音声声調認識を高精度に行う手法を開発した。 8. 音学術文献情報検索日本語・中国語音声対話システムを作成した。中国語については定形文を出力したが、日本語については応答文生成に際し、既知情報を表層文に含めることの検討を行った。日本語、中国語における動作を確認し、所期の目標を達成した。
|