• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Research-status Report

統計的音声合成を利用したインタラクティブオーディオブックと集合知への応用

Research Project

Project/Area Number 15K12071
Research InstitutionNational Institute of Informatics

Principal Investigator

山岸 順一  国立情報学研究所, コンテンツ科学研究系, 准教授 (70709352)

Project Period (FY) 2015-04-01 – 2017-03-31
Keywords音声情報処理 / 音声合成 / 集合知 / オーディオブック
Outline of Annual Research Achievements

統計的音声合成は柔軟性にすぐれ、声を変える、声を混ぜる、さらには、韻律などを発話中にリアルタイム制御することもでき、様々な声質、発話様式、方言による音声出力が実現可能である。この統計的音声合成のメリットを活かすことで、例えば、文章を読み上げる声優、使用する方言、発話様式等を自由に配置可能なオーディオブック等のアプリを作成でき、ユーザは自由にかつインタラクティブにオーディオブックを創作することが可能になると考えられる。
そこで本年度は、オーディオブックを自由にかつインタラクティブに創作することが可能なプラットフォームの試作をモバイル端末上で行った。試作したアプリはiOS上で動作し、ePubフォーマットの電子書籍をHMM音声合成にて読み上げるものである。所望の音声合成用ボイスが利用できる様、ユーザがアップロードした音声から音声合成用音響モデルを自動構築するサーバとも連携させ、自由に話者をダウンロード・選択できる様にした。また、ユーザがどの話者をどのコンテンツに利用したか、人気の話者などのメタ情報を逐次記録できる様にした。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

日本の音声情報処理技術のさらなる高度化を牽引するため、声質変換技術のコンペ(Voice Conversion Challenge 2016, vc-challenge.org)への協力、音声合成等による話者照合システムへの詐称を検出する技術のコンペ(ASVspoof 2015, www.spoofingchallenge.org) への協力、音声合成技術の医療応用(ボイスバンク)の実証実験実施など、様々な分野へ技術的・社会的貢献も基礎研究と並行して行った。

Strategy for Future Research Activity

H28年度はこれらのメタデータをユーザ間で共有出来る様にすると同時に、これらのメタデータを教師データとして機械学習に利用することで、与えられたテキストを読み上げるのにふさわしい話者、方言、発話様式の自動予測といった自然言語処理問題に挑戦する予定である。この様な「ゲーミフィケーション」と「集合知」により得られた音声合成の知見や新モジュールは、音声合成だけでなく、例えば、音声対話システムの改善にも今後利用可能であると期待される。

  • Research Products

    (5 results)

All 2016 2015 Other

All Int'l Joint Research (2 results) Journal Article (1 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 1 results) Presentation (2 results) (of which Int'l Joint Research: 2 results)

  • [Int'l Joint Research] Technical University of Madrid(スペイン)

    • Country Name
      SPAIN
    • Counterpart Institution
      Technical University of Madrid
  • [Int'l Joint Research] University of Edinburgh(英国)

    • Country Name
      UNITED KINGDOM
    • Counterpart Institution
      University of Edinburgh
  • [Journal Article] Emotion transplantation through adaptation in HMM-based speech synthesis2015

    • Author(s)
      Jaime Lorenzo-Trueba, Roberto Barra-Chicote, Rubén San-Segundo, Javier Ferreiros, Junichi Yamagishi, Juan M. Montero
    • Journal Title

      Computer Speech & Language

      Volume: 34 (1) Pages: 292, 307

    • DOI

      doi:10.1016/j.csl.2015.03.008

    • Peer Reviewed / Int'l Joint Research
  • [Presentation] WAVELET-BASED DECOMPOSITION OF F0 AS A SECONDARY TASK FOR DNN-BASED SPEECH SYNTHESIS WITH MULTI-TASK LEARNING2016

    • Author(s)
      Manuel Sam Ribeiro, Oliver Watts, Junichi Yamagishi Robert A. J. Clark
    • Organizer
      ICASSP 2016
    • Place of Presentation
      Shanghai, China
    • Year and Date
      2016-03-20 – 2016-03-25
    • Int'l Joint Research
  • [Presentation] A perceptual investigation of wavelet-based decomposition of f0 for text-to-speech synthesis2015

    • Author(s)
      Manuel Sam Ribeiro, Junichi Yamagishi, Robert A. J. Clark
    • Organizer
      Interspeech 2015
    • Place of Presentation
      Dresden, German
    • Year and Date
      2015-09-06 – 2015-09-10
    • Int'l Joint Research

URL: 

Published: 2017-01-06  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi