研究分担者 |
峯松 信明 東京大学, 大学院・情報理工学系研究科, 助教授 (90273333)
山下 洋一 立命館大学, 理工学部, 教授 (80174689)
吉田 利信 電気通信大学, 電気通信学部, 教授 (30114341)
高木 一幸 電気通信大学, 電気通信学部, 助手 (70272755)
荒木 雅弘 京都工芸繊維大学, 工芸学部, 助教授 (50252490)
新美 康永 京都工芸繊維大学, 工芸学部, 教授 (00026030)
|
配分額 *注記 |
63,400千円 (直接経費: 63,400千円)
2003年度: 20,100千円 (直接経費: 20,100千円)
2002年度: 20,700千円 (直接経費: 20,700千円)
2001年度: 22,600千円 (直接経費: 22,600千円)
|
研究概要 |
1.音声知覚における韻律の役割解明と音声認識への応用 (1)句頭アクセント核の検出とそれに基づく仮説探索制御を実装した.単語アクセントは前後の環境により変化するが,句頭に核が存在した場合は,その単語は必ず一型となる.この規則の基づき,句頭のF0情報よりその語が一型となる事後確率を求め,韻律スコアを導入した.連続音声認識システムJuliusに本モジュールを実装し,大語彙連続音声認識におけるその有効性を示した. (2)音声の時間構造を,局所話速の分析を中心に,文内の文節継続長を決定する統計モデル,文節内のモーラ継続長制御モデル,モーラ内での子音継続時間長制御モデルの3階層でモデル化した.また,それぞれのモデルについて時間構造の知覚実験を行い,時間的制約について検討した. 2.発話の構文・意味解析における韻律情報の利用 (1)これまで利用した着目文節の直後のポーズと着目文節の直後の文節の直後のポーズに加えて,着目文節の直前のポーズを利用することにより,係り受け解析の精度が向上することを確認した.また,これらのポーズ情報にF0情報を加えることにより,さらなる解析精度の向上が得られた. (2)多数の話者による音声データを用いて不特定話者条件の係り受け解析実験を行った結果,ポーズ長とF0特徴量のモデルは従来より簡単なものでよいこと,ポーズ長は平均音節継続長で正規化した方が良いことなどがわかった.また,大量のコーパスを用いて評価文に対する被覆率が高い係り受け規則を新たに作成した. 3.音韻情報と韻律情報を統合した音声認識・理解システム ディクテーションシステムにおける入力補完候補の絞込みに,アクセント情報を利用する手法を開発した.また,アクセント情報の認識・ディクテーション・入力補完機能を統合した予測型音声入力システムを実装し,アクセント情報利用の有効性を検証した. 4.韻律的特徴を用いた講演音声の自動要約 重要文抽出によって講演音声の要約を自動生成するために,文単位と文重要度を韻律情報を利用して決定する手法について検討した.ポーズで区切られた発話単位境界に対し,文境界とすべきかどうかを判断する決定木を学習し94%の分類率を得た.文重要度の決定において,連続音声認識による誤りを含む言語情報奪利用する場合の方が,正しい言語情報を利用する場合よりも,韻律情報の効果が大きいことを示した.
|