1996 Fiscal Year Annual Research Report
日本語および中国語を対象とした音声対話システムの開発
Project/Area Number |
08558028
|
Research Category |
Grant-in-Aid for Scientific Research (A)
|
Section | 試験 |
Research Institution | The University of Tokyo |
Principal Investigator |
広瀬 啓吉 東京大学, 工学系研究科, 教授 (50111472)
|
Co-Investigator(Kenkyū-buntansha) |
鈴木 敏克 東京電力株式会社, システム研究所, 主任
峯松 信明 豊橋技術科学大学, 工学部, 助手 (90273333)
大野 澄雄 東京理科大学, 基礎工学部, 助手 (80256677)
|
Keywords | 音声対話システム / 音声認識 / 音声合成 / 対話処理 / 言語自動識別 / 多言語システム / ベイズ予測分類 / HMM |
Research Abstract |
本研究は、音声入力、出力に関する制約を緩和したユーザにとって利用し易い音声対話システムを日本語と中国語の両言語に対応したシステムとして試作し、多言語音声対話システムの実用化の可能性を探ることを目的とする。本年度は、音声データベース作成、言語自動識別機能表現、音声認識機能実現等を中心として以下の成果を達成した。 1.対話システムのタスクとして、天気予報情報、World-wide Web情報を取り扱うこととし、関連のデータベースを整備するとともに、音声合成用の辞書データベースを実装した。また、音声認識学習・評価用の音声データベースを作成した。 2.収集した音声データをもとに、音素HMM、音素クラスHMMの学習を行うとともに、得られたHMMを用いて認識された音素、音素クラスの系列の特徴から日本語・中国語の識別を行う手法を開発した。さらに、系列の特徴をニューラルネットに入力することにより、対象言語以外の言語を排除することに成功した。 3.HMMの学習環境と認識環境が異なる場合に認識率の低下が小さい頑健な音声認織手法として、ビタビアルゴリズムに基づくベイズ予測分類法を提案した。これは、入力音声のモデルに対する尤度を求める際に、環境の差による非整合性が生じることを仮定するものである。特に、雑音下での認識で10%以上の認識率の顕著な向上が見られた。 4.天気予報情報のタスクについて、ユーザの質問内容と対話履歴ベースを参照しつつ知識ベースにアクセスし、必要な情報を取り出してユーザへの適切な応答内容を生成する応答内容生成手法を開発した。また、応答内容から、適切な省略・照応、語順の応答文を、韻律制御情報とともに生成する手法を開発した。これらを、既存の音声認識システム、対話音声合成システムと組み合わせて、日本語に対する音声対話システムのプロトタイプを作成した。
|
Research Products
(8 results)
-
[Publications] 広瀬啓吉: "音声対話システムの出力音声の韻律的特徴の合成" 人工知能学会全国大会論文集. 399-402 (1996)
-
[Publications] 広瀬啓吉: "Synthesizing dialogue speech of Japanese based on the quantitative analysis of prosodic features" Proc.International Conference on Spoken Language Processing. 1. 378-381 (1996)
-
[Publications] 張勁松: "Adaptive recognition method based on posterior use of distribution pattern of output probabilities" Proc.International Conference on Spoken Language Processing. 2. 1129-1132 (1996)
-
[Publications] 関慶強: "Unknown language rejection in language identification system" Proc.International Conference on Spoken Language Processing. 3. 1776-1779 (1996)
-
[Publications] 広瀬啓吉: "Use of prosodic features in speech recognition(Invited)" Proc.IEEE Invited Workshop on Pattern Recognition for Multimedia Techniques(IEEE Taegu Section). 99-108 (1996)
-
[Publications] 江輝: "Robust speech recognition based on Bayesian predictive approach" 電子情報通信学会技術研究報告. SP96-93. 45-52 (1997)
-
[Publications] 川波弘道: "対話音声の韻律的特徴の定量的分析とそれによる音声合成" 情報処理学会研究報告. 97-SLP-15-3. 15-20 (1997)
-
[Publications] 江輝: "Robust speech recognition based on Viterbi Bayesian predictive classification" Proc.IEEE International Conference on Acoustics,Speech,& Signal Processing. (発表予定). (1997)