• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実施状況報告書

客観指標を用いた雑音混入音声の主観音質推定方式

研究課題

研究課題/領域番号 25330182
研究機関山形大学

研究代表者

近藤 和弘  山形大学, 理工学研究科, 准教授 (10312753)

研究期間 (年度) 2013-04-01 – 2016-03-31
キーワード音声了解度 / 推定 / 二者択一 / 雑音 / 音声特徴量 / Articulation Index Band
研究実績の概要

携帯電話、IP電話等の普及で様々な音質、環境での音声通信が行なわれるようになってきているが、このような多様な環境下では必ずしも目的に合致した音声通話品質が確保されているとは限らない。特に音声の通信においては正確に発話内容が相手に伝わることが重要であり、音声了解度がこれを測る最も適切な尺度である。しかし、音声了解度の測定には多数の被験者を用いて相当量の音声標本を評価することが必要である。そこで、本研究では実際通信中の音声信号より了解度に関連する特徴量を算出し、この特徴量からあらかじめ学習した対応関係から了解度を高精度で測定することを目標とした。
本年度は報告者が提案している二者択一型の了解度試験法の了解度において、その二者択一の様式を忠実に反映した了解度推定方法を検討した。特徴量として人間の聴覚特性を考慮した帯域別の単語音声テンプレートと劣化音声のスペクトルの相関値を用いた。ここでテンプレートとして用いる単語は二者択一の単語対とし、相関を候補単語のテンプレート両方について求め、相関値の大きい単語を候補単語と判定する。この候補単語と実際劣化音声に含まれる音声の一致精度より了解度を推定する。
従来の推定方法が劣化音声とテンプレート音声の信号対雑音比だけから了解度を推定していたのに対し、本方法では単語対の双方の単語との一致を直接比較することで、より被験者の聴取過程を忠実に再現していることになるため、推定精度の向上が期待できる。実験の結果、未知雑音混入音声に対し被験者が実際評価した了解度と推定了解度間の相関は0.93以上、平均2乗誤差は0.14程度となった。これは従来方法に比べ極めて優位な結果である。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

未知雑音混入音声に対し、被験者が評価した主観音声了解度と推定了解度間の平均2乗誤差を0.1程度、相関を0.9程度を目標としてきた。これに対し、今回の提案では相関は0.93以上、平均2乗誤差は0.14程度であり、ほぼ目標を達成できた。以上により提案方式の効果は確認できたと考える。物理量としてスペクトル相関以外の距離尺度を用いることで、さらに改善が見込める。

今後の研究の推進方策

引き続き距離尺度を最適化し、さらに推定の平均2乗誤差の低減を目指す。
(1) 距離尺度として、すでに主観量と相関の高いことが分かっている周波数重み付信号対雑音比を用いることを検討する。この量を候補単語間で比較して推定単語とすることで、推定精度の向上を目指す。
(2)立体音響の了解度推定への拡張を目指す。音声了解度は音声の再生位置と騒音減の位置の相対関係の影響を受けることが知られている。これを利用して各音源位置による了解度への影響を学習し、未知音源位置に対しても了解度を推定する方法を検討する。

次年度使用額が生じた理由

旅費に関しては有力学会の開催が今年度はアジア地区で多く開催されたため、航空運賃が当初見積もりより少なく済んだことによる。
物品費に関しては当初購入予定にしていた音質評価ソフトの導入を見送り、自作としたため、当初見積もりより少額になっている。

次年度使用額の使用計画

旅費は今年度は有力国際学会がヨーロッパで開催されるため、航空運賃、宿泊滞在費が昨年より大幅に増加することが考えられるので、これに充てる。
物品費に関しては、蓄積データ量(音声標本)が大分増加したため、ファイルサーバを導入して安全かつ高速なデータ共有を実現し、研究効率の向上を図る。

  • 研究成果

    (8件)

すべて 2015 2014

すべて 雑誌論文 (1件) (うち査読あり 1件、 謝辞記載あり 1件) 学会発表 (7件)

  • [雑誌論文] A speech estimation method using a non-reference feature set2015

    • 著者名/発表者名
      Toshihiro Sakano, Yosuke Kobayashi, Kazuhiro Kondo
    • 雑誌名

      IEICE Transactions on Information and Systems

      巻: 98-D ページ: 21-28

    • DOI

      10.1587/transinf.2014MUP0004

    • 査読あり / 謝辞記載あり
  • [学会発表] 音声伝送系の品質劣化を考慮した屋外拡声器のブラインド了解度予測2015

    • 著者名/発表者名
      小林洋介, 西田楓, 近藤和弘
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      中央大学、東京
    • 年月日
      2015-03-16 – 2015-03-18
  • [学会発表] 音声伝送系の品質劣化を考慮した屋外拡声器の了解度評価2015

    • 著者名/発表者名
      西田楓, 小林洋介, 近藤和弘
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      中央大学、東京
    • 年月日
      2015-03-16 – 2015-03-18
  • [学会発表] AI 帯域間相関を用いた二者択一型了解度推定の基礎検討2015

    • 著者名/発表者名
      近藤和弘
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      中央大学、東京
    • 年月日
      2015-03-16 – 2015-03-18
  • [学会発表] 両耳聴音声了解度の客観推定方法の基礎検討2015

    • 著者名/発表者名
      平和也、近藤和弘
    • 学会等名
      東北地区若手研究者研究発表会
    • 発表場所
      日本大学、郡山
    • 年月日
      2015-02-28 – 2015-02-28
  • [学会発表] Estimation of Japanese DRT Intelligibility Using Articulation Index Band Correlations2014

    • 著者名/発表者名
      Kazuhiro Kondo
    • 学会等名
      Asia-Pacific Signal and Information Processing Association Annual Summit and Conference
    • 発表場所
      シエムリアップ、カンボジア
    • 年月日
      2014-12-10 – 2014-12-12
  • [学会発表] Single-Ended Estimation of Speech Intelligibility using the ITU P.563 Feature2014

    • 著者名/発表者名
      Toshihiro Sakano, Yosuke Kobayashi, Kazuhiro Kondo
    • 学会等名
      Inter-speech
    • 発表場所
      シンガポール
    • 年月日
      2014-09-15 – 2014-09-18
  • [学会発表] Gender-Dependent Babble Maskers Created from Multi-Speaker Speech for Speech Privacy Protection2014

    • 著者名/発表者名
      Kazuhiro Kondo, Hiroki Sakurai
    • 学会等名
      IEEE International Conference on Intelligent Information Hiding and Multimedia Signal Processing
    • 発表場所
      北九州国際会議場、北九州市
    • 年月日
      2014-08-27 – 2014-08-29

URL: 

公開日: 2016-05-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi