• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2017 Fiscal Year Annual Research Report

音声処理技術を活用した好感度を改善する発話訓練支援システムの研究

Research Project

Project/Area Number 16H05899
Research InstitutionUniversity of Yamanashi

Principal Investigator

森勢 将雅  山梨大学, 大学院総合研究部, 准教授 (60510013)

Project Period (FY) 2016-04-01 – 2020-03-31
Keywords教育工学 / 音声情報処理
Outline of Annual Research Achievements

本研究は,計算機による発話トレーニングの補助を目標とし,人間が発話する音声から好感度に相当する音響特徴量の抽出・制御法の確立に向けた検討を進めている.
H29年度は,好感度に相当する音響特徴量を明らかにするため,複数の主観評価を実施した.1つ目の実験では,音声の好感度評価の際に,発話のどの部位が最終的な評価に影響するかを明らかにする実験を実施した.実験の結果,発話の前半と後半では,後半のほうが最終的な評価に強く影響することが明らかとなった.2つ目の実験では,話速や抑揚を意図的に変化させるよう教示して発話させた音声を用い,それらの特徴量と主観評価のスコアとの関係性を調査した.こちらは,抑揚と大きさのダイナミックレンジが支配的であり,同時に通常よりもやや高い音声が好まれる傾向が得られた.また,男女の発話で好まれる音響特徴量が異なる(男性は大きな声であることがより好まれるなど)が示された.
音声から好感度を推定するモデルを構築するため,音声パラメータの符号化に関する検討も実施した.従来の音声パラメータは,統計的な学習をするためには膨大なサイズであるため,現在の合成音声の品質を損なわないという条件下においてパラメータを圧縮する方法を検討した.これらの検討結果から,既存の方法と比べて高い品質と圧縮率を両立する符号化法を確立することができた.
最後に,これまでの検討を受けて,好感度を改善するための声質変換法を試作した.従来の研究では,高さの変換を実施していたが,本研究では,これまでの実験により得られた知見を活用し,スペクトル包絡(音色)の加工によるアプローチに着手した.試作した方法の有効性を主観評価により検証したところ,全ての話者において有効な効果は得られていないが,特定話者について有意に好感度を改善できることが示された.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

当初の計画どおり,音声評価において時間毎に評価の重みが異なるという仮説を検証した.検証の結果,発話の後半ほど最終的な好感度スコアに近いという新たな知見を示すことができた.好感度に対応する音響特徴量の検討や,好感度推定モデルの構築も順調に進んでおり,発話から好感度を採点するためのシステムの実装も概ね完了している.好感度を向上させる声質変換技術はH30年度の課題であるが,H29年度の検討を踏まえて前倒しで試作することができた.好感度音声データベースについては論文の査読中であり,採録され次第公開する.データベース公開は当初の計画よりやや遅れているが,声質変換技術を前倒しで進めていることから,総合的には順調に進展していると判断できる.

Strategy for Future Research Activity

H29年度に試作した好感度を改善する声質変換法を改良し,どの話者にも適用可能なようにする.現在は,スペクトル包絡の制御のみで実現しているが,関連研究でも示されている基本周波数(高さ)の制御を組み合わせることで相乗効果を狙う.さらに,抑揚の大きさや発話速度など多様な加工を組み合わせることで,より高度な変換技術へと発展させる.特に,H29年度に提案した方法は,全体的に悪影響はないものの,話者により効果がまちまちであったため,その原因を究明する.元々の好感度が十分に高い発話はそのまま,好感度が低い話者の発話を適切なパラメータを用いて加工することで,誰でも高い好感度の発話が得られるようにする.そのため,好感度評価システムから変換関数の最適値を導くことに挑戦する.
次いで,これまでの研究で得られた音声評価法と新たに提案する声質変換法を組み合わせ,発話の好感度評価から改善したお手本を示すまでをまとめた発話トレーニングシステムの試作を行う.声の大きさも評価に含まれることから,現段階では発話者とマイクの距離を固定するなど,利用状況を限定した仕様で動作するプロトタイプの実装を目標とする.目標とするスマートフォンのアプリケーションとして実装することは,最終年度に検討する.

  • Research Products

    (17 results)

All 2018 2017 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results,  Open Access: 3 results) Presentation (12 results) (of which Int'l Joint Research: 1 results) Book (1 results) Remarks (1 results)

  • [Journal Article] Sound quality comparison among high-quality vocoders by using re-synthesized speech2018

    • Author(s)
      M. Morise and Y. Watanabe
    • Journal Title

      Acoust. Sci. & Tech.

      Volume: 39 Pages: 263-265

    • DOI

      https://doi.org/10.1250/ast.39.263

    • Peer Reviewed / Open Access
  • [Journal Article] Low-dimensional representation of spectral envelope without deterioration for full-band speech analysis/synthesis system2017

    • Author(s)
      M. Morise, G. Miyashita, and K. Ozawa
    • Journal Title

      in Proc. INTERSPEECH 2017

      Volume: - Pages: 409-413

    • Peer Reviewed / Open Access
  • [Journal Article] Harvest: A high-performance fundamental frequency estimator from speech signals2017

    • Author(s)
      M. Morise
    • Journal Title

      in Proc. INTERSPEECH 2017

      Volume: - Pages: 2321-2325

    • Peer Reviewed / Open Access
  • [Presentation] Time-series evaluation of men's preferences perceived from female speech2018

    • Author(s)
      T. Shono, A. Otani, M. Morise, and K. Ozawa
    • Organizer
      in Proc. NCSP 2018
    • Int'l Joint Research
  • [Presentation] 高品質音声分析合成による各パラメータのフレームシフト幅が音質に与える影響2018

    • Author(s)
      宮下玄太,森勢将雅
    • Organizer
      電子情報通信学会技術研究報告
  • [Presentation] 演技発話による疲労の表現によって生じる音色変化の分析2018

    • Author(s)
      生野琢郎,森勢将雅
    • Organizer
      電子情報通信学会技術研究報告
  • [Presentation] 高品質音声符号化のためのスペクトル包絡・非周期性指標量子化の知覚的影響2018

    • Author(s)
      宮下玄太,森勢将雅
    • Organizer
      電子情報通信学会技術研究報告
  • [Presentation] 高品質音声符号化のための基本周波数量子化の知覚的影響2018

    • Author(s)
      宮下玄太,森勢将雅
    • Organizer
      情報処理学会第80回全国大会
  • [Presentation] 音声から知覚する疲労度に対応する音響特徴量の策定2018

    • Author(s)
      生野琢郎,森勢将雅
    • Organizer
      情報処理学会第80回全国大会
  • [Presentation] 高品質音声分析合成を用いた基本周波数の実時間操作インタフェースの実装2017

    • Author(s)
      渡邊優介,森勢 将雅,小澤賢司
    • Organizer
      情報処理学会音楽情報科学研究会
  • [Presentation] フルバンド音声を対象とした音声分析合成システムに用いるスペクトル包絡の音質劣化のない低次元表現2017

    • Author(s)
      宮下玄太,森勢将雅,小澤賢司
    • Organizer
      情報処理学会音楽情報科学研究会
  • [Presentation] 誇張した時間的揺らぎが歌声の人間性知覚に与える影響2017

    • Author(s)
      森勢将雅,豊田裕一,小澤賢司
    • Organizer
      情報処理学会音楽情報科学研究会
  • [Presentation] 分析合成音を用いた音声分析合成方式の性能比較2017

    • Author(s)
      渡邊優介,森勢将雅
    • Organizer
      日本音響学会2017年秋季研究発表会
  • [Presentation] フルバンド音声を対象とした品質劣化のない音声分析合成のためのフレームシフト幅の検証2017

    • Author(s)
      宮下玄太,森勢将雅
    • Organizer
      日本音響学会2017年秋季研究発表会
  • [Presentation] 好感度を対象とした音声データベースの構築 -発話テキストの選定とテキストから受ける好感度の評価-2017

    • Author(s)
      森勢将雅,横森文哉,小澤賢司
    • Organizer
      日本音響学会2017年秋季研究発表会
  • [Book] 人工知能学大事典2017

    • Author(s)
      人工知能学会
    • Total Pages
      1600
    • Publisher
      共立出版
    • ISBN
      978-4-320-12420-2
  • [Remarks] 音声分析合成システムWORLD

    • URL

      http://www.kki.yamanashi.ac.jp/~mmorise/world/

URL: 

Published: 2018-12-17  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi