• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

音声知覚特性の解析に対する音声認識技術の適用

研究課題

研究課題/領域番号 18652040
研究機関和歌山大学

研究代表者

入野 俊夫  和歌山大学, システム工学部, 教授 (20346331)

研究分担者 河原 英紀  和歌山大学, システム工学部, 教授 (40294300)
西村 竜一  和歌山大学, システム工学部, 助手 (00379611)
高橋 徹  和歌山大学, システム工学部, 研究員 (30419494)
キーワード音声信号処理 / 音声認識器 / 聴覚心理実験 / 模擬難聴 / 単語知覚
研究概要

本年度は、我々がすでに実施してきた劣化音声の知覚実験の結果と対比するべく、劣化音声を入力とした音声認識実験を実施した。この知覚実験は、高音質分析合成法STRAIGHTを用いて作成した劣化音声を健聴者に聞かせて、聞き取れた通り仮名表記で答えさせたものである。この劣化音声は、STRAIGHTスペクトルを、周波数方向・時間方向・時間周波数両方向平滑化したのち合成して得た。使用した単語は4モーラで、親密度が最も低いグループより選び、明示的な言語知識を極力使えないようにした。
これと同様な認識実験を、音声認識ソフトJulianを用いて行った。まず単語音声を、聴取実験と同様にそれぞれの劣化条件に合わせてSTRAIGHTを用いて劣化させた。それから得られた音声特徴量MFCC係数と音韻ラベルを用いて音声認識器を学習させた。また、予備実験により親密度の影響がないことを確認した上でデータベース中の全単語を用いて学習データ数を増やし、さらに劣化条件ごとに学習データを準備して、クローズド実験とオープン実験の両方を行った。この結果、音声認識器の認識率と人間の認識率では、想定していたとおり傾向は異なった。特に異なるのは、劣化条件が緩やかな場合で、むしろ劣化条件が厳しい条件では似た傾向を示すようになることもわかった。これに対して人間と共通な特性として、劣化の度合いに関わらず、第1・第3モーラ目の認識率が、第2・第4モーラ目の認識率よりも低いという結果が出てきた。これは、日本語単語内における音節系列の統計的な偏りによるものであると考えている。
この認識実験と平行して知覚特性の基礎データを得るため劣化音声の聴取実験も、単語の提示音圧レベルを低減した場合や、調音結合を排除するために単音節を4つ並べて単語とした場合について実施した。また、健聴者の劣化音声知覚と難聴者の通常音声知覚の対比を行うために、弁別素性を元にした異聴傾向の把握も行った。

  • 研究成果

    (2件)

すべて 2007 2006

すべて 雑誌論文 (2件)

  • [雑誌論文] 音声認識を用いた劣化音声に含まれる情報の検討2007

    • 著者名/発表者名
      松村勇作, 入野俊夫, 西村竜一, 河原英紀
    • 雑誌名

      日本音響学会,春季研究発表会講演論文集

      ページ: 475-476

  • [雑誌論文] 弁別素性に基づく異聴表による健聴者と難聴者の音声知覚の対比2006

    • 著者名/発表者名
      中家諒, 入野俊夫, 中市健志, 坂本真一, 河原英紀
    • 雑誌名

      日本音響学会 : 秋季研究発表会講演論文集

      ページ: 369-370

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi