• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実績報告書

聴覚の情報表現に基づく高度音声分析変換合成方式の研究

研究課題

研究課題/領域番号 24300073
研究種目

基盤研究(B)

研究機関和歌山大学

研究代表者

河原 英紀  和歌山大学, システム工学部, 教授 (40294300)

研究分担者 入野 俊夫  和歌山大学, システム工学部, 教授 (20346331)
戸田 智基  奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90403328)
坂野 秀樹  名城大学, 理工学部, 准教授 (20335003)
榊原 健一  北海道医療大学, 心理科学部, 准教授 (80396168)
森勢 将雅  山梨大学, 大学院・医学工学総合研究部, 助教 (60510013)
研究期間 (年度) 2012-04-01 – 2015-03-31
キーワード音声分析 / 音声変換 / 音声合成 / 標本化 / 心理実験 / 音声生成 / 発声評価 / 音声訓練
研究概要

本研究計画では、(1)音源情報の精密な分析合成技術、(2)疎な表現からのスペクトル形状復元技術、(3)汎用情報基盤へのツール群の実装、という3つの目標の実現に向けて、(1)基盤となる理論の構築とアルゴリズムの開発、(2)汎用情報基盤に適したアルゴリズムと実装技術の開発、(3)評価用データベースの構築および評価用応用アプリケーションの開発、(4)客観評価実験および主観評価実験の遂行、を担当するグループにより、相互の密接な連携の下に研究を進めた。その結果、音声の分析において高速かつ精密な基本周波数抽出法を発明するとともに、新たな標本化理論に基づいて、ボトムアップの方法であるSTRAIGHTに、疎な表現でありトップダウンの方法である線形予測分析を新たな形で結びつける可能性を見いだした。また、重点項目であった音源情報に関しては、非周期成分の表現を改良することにより、品質を改善することに成功した。また、基盤技術としてのモーフィングをサポートする相対的声道長の新しい推定法を発明することにより、100倍以上の高速化と推定精度の向上を達成した。さらに、これらのアルゴリズムを応用することを促進することを狙い、実装の汎用化を進めた。また、プラットフォームとして、タブレットを導入し、試験的評価を開始した。評価用データベースの構築に関しては、物理特性が超低域まで厳密に規定されている音声収録系を構築し、従来の分析法では分析が困難な多様な発声による音声を収録し、整備を開始した。これらに加え、主観実験を効率的に遂行するとともに統一的な分析が可能となる一般化線形モデルとの整合性の良い、実験用のシステムを開発した。これらは次年度以降の本格的な実験を効率的に進める上での重要な基盤となる。また、本課題で得られた成果は、適宜、国際会議などの機会を利用して公開するとともに、社会への還元に努めた。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

基礎アルゴリズムに当初想定していなかった大きな発見があった。このような発見は、予想および計画することが困難なものであるが、その結果、本研究が大きく進展することとなった。データベースの収録については、本格的収録に移行するための準備が、前述の発見もあり、十分に整備された状況にあることとなった。これらを総合し、当初の計画以上に進展していると判断する。

今後の研究の推進方策

今回の発見ならびに、現在形を成しつつあるもう2つの大きな発明を活用することで、当初計画を更に効果的にすることを狙う。

次年度の研究費の使用計画

次年度は、データベースの収録および評価実験、ならびに成果発表への使用が中心となる。また、成果のタブレット端末への実装のための準備を進める。

  • 研究成果

    (16件)

すべて 2013 2012

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (15件)

  • [雑誌論文] 基本周波数の転写に基づく実時間歌唱制御システムの実現を目的とした高品質ボコーダSTRAIGHTの高速化2012

    • 著者名/発表者名
      中野皓太, 森勢将雅, 西浦敬信, 山下洋一
    • 雑誌名

      電子情報通信学会論文誌A

      巻: J95-A ページ: 563-572

    • 査読あり
  • [学会発表] 波形の対称性に基づく基本波成分抽出と声帯振動との比較について2013

    • 著者名/発表者名
      河原 英紀, 森勢 将雅, 榊原 健一
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      東京工科大学、八王子
    • 年月日
      2013-03-15
  • [学会発表] 高い時間分解能を有するスペクトルおよび基本周波数抽出法に基づくシャウト歌唱の分析について2013

    • 著者名/発表者名
      西垣 友理, 西村 竜一, 入野 俊夫, 河原 英紀
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      東京工科大学、八王子
    • 年月日
      2013-03-13
  • [学会発表] スクリーム唱法における基本周波数とスペクトル変動の相関の調査2013

    • 著者名/発表者名
      西脇裕展, 坂野秀樹, 旭 健作
    • 学会等名
      電子情報通信学会音声研究会
    • 発表場所
      同志社大学、京都
    • 年月日
      2013-01-31
  • [学会発表] 歌唱音声における基本周波数とパワーの変動量を反映するビブラート特徴量の提案とその評価方法について2013

    • 著者名/発表者名
      鈴木千文, 坂野秀樹, 旭 健作, 板倉文忠, 森勢将雅
    • 学会等名
      電子情報通信学会音声研究会
    • 発表場所
      同志社大学、京都
    • 年月日
      2013-01-31
  • [学会発表] An interference-free representation of group delay for periodic signals2012

    • 著者名/発表者名
      Hideki Kawahara, Masanori Morise, Ryuichi Nisimura and Toshio Irino
    • 学会等名
      APSIPA ASC 2012
    • 発表場所
      ロサンゼルス、米国
    • 年月日
      2012-12-04
  • [学会発表] 調波間の干渉に基づく周期信号を対象とした位相推定法の提案2012

    • 著者名/発表者名
      森勢将雅, 山下洋一
    • 学会等名
      第27回信号処理シンポジウム
    • 発表場所
      石垣市、沖縄
    • 年月日
      2012-11-28
  • [学会発表] 時間周波数表現の標本化から音声の分析変換合成を考える2012

    • 著者名/発表者名
      河原英紀
    • 学会等名
      数理解析研究所講究録
    • 発表場所
      大阪教育大学、大阪(招待講演)
    • 年月日
      2012-11-10
  • [学会発表] Simplified aperiodicity representation for high-quality speech manipulation systems2012

    • 著者名/発表者名
      Hideki Kawahara, Masanori Morise
    • 学会等名
      ICSP2002
    • 発表場所
      北京、中国
    • 年月日
      2012-10-22
  • [学会発表] 母音区間情報に基づく声道長正規化と身体情報の基礎的検討2012

    • 著者名/発表者名
      小林 真優子, 西村 竜一, 入野 俊夫, 河原 英紀
    • 学会等名
      日本音響学会秋季研究発表会
    • 発表場所
      神奈川大学、横浜
    • 年月日
      2012-09-21
  • [学会発表] 音高変化における歌声のスペクトル包絡の傾斜分析の検討2012

    • 著者名/発表者名
      池田健二, 森勢将雅, 中山雅人, 西浦敬信
    • 学会等名
      日本音響学会秋季研究発表会
    • 発表場所
      神奈川大学、横浜
    • 年月日
      2012-09-21
  • [学会発表] 周期信号の瞬時周波数および群遅延の安定な表現について2012

    • 著者名/発表者名
      河原 英紀, 森勢 将雅, 西村 竜一, 入野 俊夫
    • 学会等名
      日本音響学会秋季研究発表会
    • 発表場所
      神奈川大学、横浜
    • 年月日
      2012-09-20
  • [学会発表] Implementation of computationally efficient real-time voice conversion2012

    • 著者名/発表者名
      T. Toda, T. Muramatsu, H. Banno
    • 学会等名
      Interspeech2012
    • 発表場所
      ボートランド、米国
    • 年月日
      2012-09-10
  • [学会発表] Deviation measure of waveform symmetry and its application to high-seed and temporally-fine FO extraction for vocal sound texture manipulation2012

    • 著者名/発表者名
      Hideki Kawahara, Masanori Morise, Ryuichi Nisimura, Toshio Irino
    • 学会等名
      Interspeech2012
    • 発表場所
      ボートランド、米国
    • 年月日
      2012-09-10
  • [学会発表] 周期信号の群遅延の安定な表現について2012

    • 著者名/発表者名
      河原 英紀, 森勢 将雅, 西村 竜一, 入野 俊夫
    • 学会等名
      電子情報通信学会技術研究報告
    • 発表場所
      北海道医療大学、札幌
    • 年月日
      2012-07-19
  • [学会発表] 音源およびスペクトル包絡の時間的微細構造の加工と歌唱音声の印象への影響2012

    • 著者名/発表者名
      河原 英紀, 森勢 将雅, 西村 竜一, 入野 俊夫
    • 学会等名
      第95回音楽情報科学研究会
    • 発表場所
      東京大学、東京
    • 年月日
      2012-06-02

URL: 

公開日: 2014-07-16   更新日: 2014-12-03  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi