2004 Fiscal Year Annual Research Report
汎用音声符号系を用いた音声の統一的符号化と音声処理応用システムの研究
Project/Area Number |
15300026
|
Research Institution | University of Tsukuba |
Principal Investigator |
田中 和世 筑波大学, 大学院・図書館情報メディア研究科, 教授 (70344207)
|
Co-Investigator(Kenkyū-buntansha) |
伊藤 慶明 岩手県立大学, ソフトウエア情報学部, 助教授 (90325928)
大川 茂樹 千葉工業大学, 情報科学部, 助教授 (40306395)
児島 宏明 独立行政法人産業技術総合研究所, 情報技術研究部門, 主任研究員
|
Keywords | 汎用音声符号 / 音声検索 / 音声認識 / 高速マッチング / 音声音響モデル / 多言語音声処理 |
Research Abstract |
汎用音声符号系として提案しているサブ音声セグメント(Sub-Phonetic Segment : SPS)について、英語音声に対しても変換規則をほぼ確立すると共に、その音響モデルの構築を行った。音声検索システムによる検証では英語の場合SPSの個数が増加するので、音響モデルの構築には引き続き精度向上のための方策が必要である。 SPSを基本とする語彙に依存しない音声検索システムの開発については、SPSが他の音声記述単位である音節や音素(triphoneを含む)の音響モデルに比べて性能的に優位にあることを検証した。また、同時に、SPSに加えてこれらの音響モデルを合わせて用いた場合、より高精度の検索性能が出ることを示した。さらに、SPSに基く検索システムの応用として、ニュース放送などのビデオ検索システムを試作し、人名や地域名など辞書に未登録の語彙外音声による情報検索が可能であることを実証した。 SPS系列などの任意区間同士の高速マッチング手法として新たに開発したRelay CDP(continuous dynamic programming)を音声類似区間検出に適用して有効性を検証した。これにより音声ドキュメントのインデキシングへの応用の可能性を示した。 音声自動認識・検索などの高度化に必要な音響特徴抽出および音韻モデル構築のための要素技術として,マルチストリーム型モデルを用いた音声認識における特徴量の有効性を検討した。また、複数マイクロホン入力に対するディジタル信号処理を用いた雑音除去手法の検討を進めた。 本プロジェクトで開発を進めている特徴抽出手法、音声記述単位SPS、高速マッチング手法などは広く応用できる手法であり、現在、音声に限らず楽音・歌声識別、楽曲境界検出、類似薬品名提示、生活環境音の記述などに応用したシステムを試作中である。
|
Research Products
(22 results)
-
-
[Journal Article] An auto-regressive, nonstationary excited signal parameter estimation method and an evaluation of a singing-voice recognition2005
Author(s)
Sasou, A., Goto, M., Hayamizu, S., Tanaka, K.
-
Journal Title
Proc.of International Conference on Acoustics, Speech, and Signal Processing (IEEE ICASSP2005) 1
Pages: 4
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-