• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実績報告書

フレキシブルな時間軸による音声再生システムの研究と研究者用音声データベースの作成

研究課題

研究課題/領域番号 23500147
研究機関電気通信大学

研究代表者

高橋 弘太  電気通信大学, 情報理工学(系)研究科, 准教授 (10188005)

キーワード話速変換 / 音声データベース / 話速推定
研究概要

本研究課題は,その前の研究課題として科研費の助成を受けて行った「フレキシブルな時間軸による再生機」の研究をさらに押し進め,フレキシブルな時間軸による再生機の研究の中の要素技術である話速推定の技術や,話速変換のための信号処理技術を体系的に研究するものである.また,本研究課題では,その研究に用いる必要性のためだけでなく,全国の研究者が無償で利用できるように,音声データベースの構築も行っている.
本年度は,「フレキシブルな時間軸による再生機」の研究においては,C言語による開発環境をさらに拡充した.具体的には,信号処理を処理要素ごとに分解して記述し,その要素を連結することで処理が行えるようにした.また,全体の構造を図的に表示するツールも独自に開発した.FPGAによるシステムについては,インタラクティブな操作ができるような独自のハードウエアも開発した.
また,「音声データベースの構築」に関しては,2種類の音源を新たに採取し,編集し公開を行った.今回採取した第一のデータセットは,一文字違いで文意が異なる文章の読み上げである.これは聞き間違えの定量評価に利用することができる.第二のデータセットは,カーナビのガイド音声を模擬した原稿の読み上げである.こちらは,実社会における応用を念頭に置いて製作した.距離や方向の表現を複数種類作り,それらの組み合わせを原稿として製作してこれを読み上げてもらった後に切り分けて編集することで,様々な組み合わせのガイド音声が成績できるようになっている.この2つのデータセットは,話速を変えてアナウンサーに読み上げてもらい,SN比の良好な音声データベースとして作成することができた.また,時間をかけてリップノイズも取り除いてあり,利用価値が高い高品質なものとなったと考えている.今後は,これらの成果を踏まえ研究をさらに層の厚いものにして,実用化に近づけていきたい.

  • 研究成果

    (5件)

すべて 2013 その他

すべて 雑誌論文 (2件) 学会発表 (2件) 備考 (1件)

  • [雑誌論文] 時間伸長音声のための局所的ピッチ変換規則の検討2013

    • 著者名/発表者名
      井上愛梨,高橋弘太
    • 雑誌名

      信学技報

      巻: 112(478) ページ: 19-24

  • [雑誌論文] 長時間音声を聴くための時間節約技術とそのFPGA実装2013

    • 著者名/発表者名
      鈴木達弘,高橋弘太
    • 雑誌名

      信学技報

      巻: 112(467) ページ: 47-52

  • [学会発表] 音響圧縮形式の時間周波数解析を利用した音信号混合法

    • 著者名/発表者名
      宮地紘司, 大脇渉, 高橋弘太
    • 学会等名
      電子情報通信学会,応用音響研究会
    • 発表場所
      NHK放送技術研究所
  • [学会発表] 急峻な周波数変化に対応した信号解析法とスマートミキサーへの応用

    • 著者名/発表者名
      有北知弘, 大脇渉, 宮地紘司, 高橋弘太
    • 学会等名
      電子情報通信学会,応用音響研究会
    • 発表場所
      NHK放送技術研究所
  • [備考] 話速バリエーション型音声データベース

    • URL

      http://www.it.ice.uec.ac.jp/SRV-DB/

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi