1998 Fiscal Year Annual Research Report
Project/Area Number |
09480061
|
Research Institution | The University of Tokyo |
Principal Investigator |
広瀬 啓吉 東京大学, 大学院・工学系研究科, 教授 (50111472)
|
Co-Investigator(Kenkyū-buntansha) |
峯松 信明 豊橋技術科学大学, 工学部, 助手 (90273333)
|
Keywords | 韻律的特徴 / 対話音声 / 音声認識 / 音声合成 / 波形接続型音声合成 / 学術情報検索システム / モーラ遷移統計モデル / 韻律ラベル |
Research Abstract |
音声の韻律的特徴を積極的に着目し、音声合成と音声認識の高度化を実現することを目的とする。本年度は、音声合成と韻律の統計モデルを中心として以下の成果を達成した。 1. 対話調音声合成のためのモーラ持続時間制御規則を作成した。これは、基本周波数パターンによって韻律文、韻律句、韻律語などの韻律単位を定義した上で、単位毎に朗読音声のモーラ持続時間を対話音声のそれに変更することを基本とする。 2. 波形接続型の音声合成において、波形のLMAフィルタ分析によりピッチマークを自動的に付与する手法を開発するとともに、部分的零位相化により、ピッチ変更の際に問題となるエコー性ノイズを低減する手法を検討した。 3. 学術情報検索をタスクとする音声対話システムのプロトタイプを、特に、省略表現の制御、1回の応答に含むべき情報量、ユーザ/システム主導の選択、対話らしい音声の生成、入力の種類による認識用文法の選択、について考慮して構築した。音声認識部、対話管理部、検索部、音声合成部からなるが、このうち、対話管理部は認識結果を解析してシステムの動作を決定するとともに、応答文概念から応答文を生成する。対話管理は状態遷移表に基づいて行う。 4. アクセント句の基本周波数パターンをアクセント型別にモーラ遷移確率モデルによって表現することで、連続音声のアクセント句のアクセント型識別と境界検出を同時に行う手法を構築した。ATR連続音声データベースを対象とした実験を行い、77%のアクセント句境界検出率(挿入誤り15%)を得た。また、語彙制約のない連続音声認識に利用し、モーラ認識率の向上を確認した。 5. 韻律ラベルされた音声データベースの自動作成のため、基本周波数パターンにフィルタ操作、微分操作等を施すことによって韻律境界を抽出する手法を開発した。抽出誤りを、韻律に関する知見を利用して修正することの有効性を確認した。
|
Research Products
(16 results)
-
[Publications] Keikichi Hirose: "Accent type recognition and syntactic boundary detection of Japanese using statistical modeling of moraic transitions of fundamental frequency contours" Proc.IEEE International Conference on Acoustics,Speech,& Signal Processing. 1. 25-28 (1998)
-
[Publications] 岩野公司: "モーラ遷移確率モデルを用いたアクセント型の識別とによるアクセント句境界の検出" 電子情報通信学会技術研究報告(音声研究会). 1-8 (1998)
-
[Publications] 川波弘道: "韻律構造を考慮した対話音声の発話速度の分析と合成" 情報処理学会研究報告(音声言語情報処理研究会). 49-54 (1998)
-
[Publications] 広瀬啓吉: "韻律情報の処理" 信号処理. 2・6. 415-423 (1998)
-
[Publications] Koji Iwano: "Representing prosodic words using statistical models of moraic transition of fundamental frequency contours of Japanese" Proc.International Conference on Spoken Language Processing. 3. 599-602 (1998)
-
[Publications] Keikichi Hirose: "On the relationship of speech rates with prosodic units in dialogue speech" Proc.International Conference on Spoken Language Processing. 5. 1979-1982 (1998)
-
[Publications] Atsuhiro Sakurai: "A linguistic and prosodic database for data-driven Japanese TTS synthesis" Proc.International Conference on Spoken Language Processing. 7. 2843-2846 (1998)
-
[Publications] 岩野公司: "モーラ遷移確率モデルによるアクセント句境界検出と連続音声認識への応用" 情報処理学会研究報告(音声言語情報処理研究会). 73-78 (1999)
-
[Publications] 夏目貴史: "言語的な情報を利用した韻率データベース作成の自動化" 日本音響学会研究発表会講演論文集. I(発表予定). (1999)
-
[Publications] 桜井淳宏: "音声データベースのための複合名詞におけるアクセント変形タイプの自動推定" 日本音響学会研究発表会講演論文集. I(発表予定). (1999)
-
[Publications] 桐山伸也: "文献検索をタスクとした音声対話システムの検討" 日本音響学会研究発表会講演論文集. I(発表予定). (1999)
-
[Publications] 川波弘道: "対話調音声の韻律的特徴の生成規則作成とその評価" 日本音響学会研究発表会講演論文集. I(発表予定). (1999)
-
[Publications] 村松茂樹: "波形編集型音声合成におけるエコー抑制の検討" 日本音響学会研究発表会講演論文集. I(発表予定). (1999)
-
[Publications] 岩野公司: "句境界情報を利用した語彙制約のない姓名認識" 日本音響学会研究発表会講演論文集. I(発表予定). (1999)
-
[Publications] Koji Iwano: "Prosodic word boundary detection using statistical modeling of moraic fundamental frequency contours and its use for continuous speech recognition" Proc.IEEE International Conference on Acoustics,Speech,& Signal Processing. 1(発表予定). (1999)
-
[Publications] 岩野公司: "モーラを単位とした基本周波数パターンの確率モデル化とそれによるアクセント句境界の検出" 情報処理学会論文誌. 40・4(発表予定). (1999)