• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2000 Fiscal Year Annual Research Report

音声認識・理解における韻律情報の利用

Research Project

Project/Area Number 12132203
Research Category

Grant-in-Aid for Scientific Research on Priority Areas (B)

Research InstitutionThe University of Electro-Communications

Principal Investigator

尾関 和彦  電気通信大学, 電気通信学部, 教授 (50214135)

Co-Investigator(Kenkyū-buntansha) 峯松 信明  東京大学, 大学院・工学系研究科, 助教授 (90273333)
山下 洋一  立命館大学, 理工学部, 助教授 (80174689)
新美 康永  京都工芸繊維大学, 工芸学部, 教授 (00026030)
高木 一幸  電気通信大学, 電気通信学部, 助手 (70272755)
吉田 利信  電気通信大学, 電気通信学部, 教授 (30114341)
Keywordsスペクトル包絡変動 / 局所話速 / 韻律句境界情報 / 発話文係り受け解析 / アクセント型認識 / 講演音声要約
Research Abstract

1.(1)ピッチ変化に起因するスペクトル包絡変動に関し,対象を有声子音及び無声子音に拡張して定量的分析を行った.その結果,有声子音のスペクトル包絡はピッチに依存して変動すること,無声子音にも補間ピッチに依存してスペクトルが変動するものがあること,などが明らかになった.
(2)特殊拍の換算モーラ数算出法を考案した.また,局所話速に対する音素継続時間長の分布を求めた.その結果,分布は対象音素とその音素環境ごとに異なることが分かり,音素継続時間長の制御においては,局所話速とそれらの要因を共に考慮する必要のあることが明らかになった.
2.(1)韻律句境界情報に基づいて,大語彙連続音声認識の仮説探索におけるビーム幅,およびcross-word音響モデルの利用を制御する方式を提案し,認識実験によりその有効性を示した.
(2)ポーズ,ピッチ,パワーなどに関連する多数の韻律的特徴量を取り上げ,係り受け解析におけるそれらの有効性を定量的に評価した.また,ポーズの継続時間長について,継続時間長が0のデータと正のデータを個別にモデル化することにより,係り受け解析の正解率が向上することを確認した.
3.連続音声中の韻律句のアクセント型を,隠れマルコフモデル(HMM)により認識する実験を行った.アクセント型は「0型」,「1型」,「N型(N【greater than or equal】2)」に分類した.音素HMMを用いて入力音声をモーラ単位に分割し,各モーラをさらにいくつかに等分したものをピッチパラメータ抽出の単位とした.クローズテストで約70%の認識率を得た.
4.テレビ論説番組の書き起こし文章に対し,被験者の判断により各文の重要度を定め,これと,音素長,パワー,ピッチなどの韻律的特徴量との相関を求めた.その結果,文単位では,パワーについてのみ明確な相関が見られるが,文中の最も特徴量の値が大きい単語を選んで相関を求めた場合は,すべての特徴量について明確な相関があることが明らかになった.

  • Research Products

    (5 results)

All Other

All Publications (5 results)

  • [Publications] Shi-wook Lee: "Efficient search strategy in large vocabulary continuous speech recognition using prosodic boundary information"Proceedings of ICSLP'2000. 4. 274-277 (2000)

  • [Publications] Yukiyoshi Hirose: "Effectiveness of prosodic features in syntactic analysis of read Japanese sentences"Proceedings of ICSLP'2000. 3. 215-218 (2000)

  • [Publications] 峯松信明: "日本語音声におけるスペクトル包絡と基本周波数間の依存性に関する定量的分析"電子情報通信学会技術研究報告. (発表予定). (2001)

  • [Publications] 笠原力弥: "講演音声における重要文と韻律的特徴的関係"情報処理学会音声言語処理研究会報告. SLP-35-5. 25-30 (2001)

  • [Publications] 中野信幸: "局所話速を用いた音素継続長の制御"日本音響学会講演論文集. I. 345-347 (2001)

URL: 

Published: 2002-04-03   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi