• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実施状況報告書

聴覚の情報表現に基づく機能性音声デザイン機構の研究

研究課題

研究課題/領域番号 26540087
研究機関和歌山大学

研究代表者

河原 英紀  和歌山大学, システム工学部, 教授 (40294300)

研究分担者 森勢 将雅  山梨大学, 大学院医学工学総合研究部, 助教 (60510013)
研究期間 (年度) 2014-04-01 – 2016-03-31
キーワード音声情報処理 / 非言語音声情報
研究実績の概要

自然な文字である手書き文字よりも、適切にデザインされた活字は遥かに読み易い。音声言語も、適切にデザインすることにより、自然な肉声そのままのものよりも、明瞭に聴き取ることができ、内容を良く理解し記憶でき、より深い感動を得、心の平安を得、警戒心を喚起できるなど、用途に応じたものとすることができる可能性がある。本研究課題では、申請者らが進めている、聴覚と同型の情報表現に基づく最新の音声分析・変換・合成技術(STRAIGHTを分析・合成の基盤とし、時変多属性かつ任意事例数での外挿を可能とするように拡張されたモーフィング技術)を利用することにより、用途に応じた機能を有する音声のデザインを可能とするシステムのプロトタイプ構築を目的として研究を進めた。
初年度は、探査的研究用基盤システムの構築を狙い、その第一段階として、科学技術計算環境であるMatlabの実時間入力機能と、イベント駆動型プログラムを利用した一群のツールを整備した。このツールは、既に確立されている技術を、対話的に直感的な操作で利用できるようにしたものであり、広く公開している。とくに、音声信号からリアルタイムで声道形状を推定し表示するシステムは、非常に高い関心を呼び、Edinbrough大学をはじめとした海外の教育研究機間においても活用されている。さらに、この声道形状推定の過程で求められるパラメタを応用することで、STRAIGHTによる分析結果を、声道形状を介して操作する方法を発見した。この表現は、これまでモーフィング応用の際の大きな障害となっていた参照点の設定を不要とする可能性があり、重要な突破口が開かれたと言える。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

達成目標として挙げた、(1) 前意識的影響を定量化する実験手法および音声加工ツール、(2) 好感度を 改善する音声のデザインテンプレートの作成、(3) 警戒心を喚起する音声のデザインテンプレートの作成。可能であれば、安心感や信頼感を促進する音声のデザインテンプレートの作成を狙うとした各項目の根幹となる、探査的研究用基盤システムの構築が大きく進展した。これには、二つの要因が関わっている。一つは、研究のツール開発のために用いている科学技術計算環境であるMatlabにおける実時間プログラムのための枠組みの確立である。これにより、探索的な検討のスループットを大きく向上させることができた。その結果、もう一つの要因である、声道形状を介したSTRAIGHTパラメタの操作が可能となり、デザインテンプレートの検討を効率化することが可能となったのである。さらに、この要因は、拡張された時変多属性任意事例数モーフィングを利用する上で障害となっていた、参照点の付与という操作を取り除くことにつながる。さらに、自励振動子と近似時変フィルタおよび局所的時間軸伸縮を用いることにより、実時間で品質劣化を招かずに音声に強い印象を与える属性を付与する方法を実現する枠組みを構築した。その上、短時間Fourier変換における巧妙な工夫により、STRAIGHTを凌ぐ品質での分析合成を可能とするCheap Trickという方法も発明されるに至った。この方法は、これまでSTRAIGHTに基づいて開発されて来た、モーフィング等、様々な応用技術においてSTRAIGHTを置き換えることも可能である。これらは、当初計画していた予想を超える成果であり、本課題を大きく進展させるものである。

今後の研究の推進方策

平成27年度は、前年度で得られた声道形状を介した操作体系を、その数理的背景にあるLSP(Line Spectrum Pair)を介することにより、時変多属性任意事例数モーフィングの自動化と、適切なユーザインタフェースの概念化の検討を進め、実際に利用可能なプロトタイプの提供までを目指す。また、この際、スペクトル推定部分に分担者の森勢によるCheap Trickの組み込みを進める。その際に、システムのパラメタを適切に設定するため、本格的な主観評価実験を行い、結果を資料化する。また、こうして構築したプロトタイプを利用することにより、様々な機能を有する音声のデザインテンプレートを作成する。

次年度使用額が生じた理由

初年度の終盤において、本課題の成果の応用可能性を大きく広げる可能性のある情報表現と操作体系に関する発見があった。また、新たなスペクトル推定法の発明という、予想を大きく超える成果が得られた。これらを踏まえ、この新しい表現と操作体系に基づく基盤アルゴリズムとソフトの開発を重点化することとした。そのため、当初計画していた主観評価実験を、初年度は予備実験の規模にとどめ、次年度に、この新しく構築した基盤アルゴリズムとそれに基づくソフトを対象として、本格的な主観評価実験を行うこととした。そのために、初年度の規模を縮小した分を、次年度使用額とすることにより、次年度の実験の規模の拡大を可能とした。

次年度使用額の使用計画

初年度に発見された情報表現と操作体系に基づいて基盤アルゴリズムとそれに基づく応用システムのソフトを開発し、評価する。そのために、開発の各段階で必要となる主観評価実験を本格化し、それらに基づいて、目標とするデザインテンプレートを拡充する。これらに、前述の次年度使用額を活用することで、より充実した成果とすることを狙う。

  • 研究成果

    (18件)

すべて 2015 2014 その他

すべて 雑誌論文 (2件) (うち査読あり 2件、 謝辞記載あり 2件、 オープンアクセス 1件) 学会発表 (13件) (うち招待講演 4件) 図書 (1件) 備考 (2件)

  • [雑誌論文] CheapTrick, a spectral envelope estimator for high-quality speech synthesis2015

    • 著者名/発表者名
      Masanori Morise
    • 雑誌名

      Speech Communication

      巻: 67 ページ: 1-7

    • DOI

      10.1016/j.specom.2014.09.003

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] 音声の実時間表示とモーフィングで探る声の多様性2014

    • 著者名/発表者名
      河原英紀
    • 雑誌名

      音声研究

      巻: 18 ページ: 578-588

    • 査読あり / 謝辞記載あり
  • [学会発表] 音声の好感度に対する声道形状および音源情報操作の効果について2015

    • 著者名/発表者名
      吉元 照貴,西村 竜一,入野 俊夫,河原 英紀
    • 学会等名
      日本音響学会:春季研究発表会講演論文集
    • 発表場所
      中央大学、東京
    • 年月日
      2015-03-16 – 2015-03-18
  • [学会発表] 声道形状と声帯音源特性を利用したグロウル系歌唱音声への変換について2015

    • 著者名/発表者名
      溝渕 翔平,西村 竜一,入野 俊夫,河原 英紀
    • 学会等名
      日本音響学会:春季研究発表会講演論文集
    • 発表場所
      中央大学、東京
    • 年月日
      2015-03-16 – 2015-03-18
  • [学会発表] 音声の好感度改善補助ツールの開発を目指した好感度改善方法の検討2015

    • 著者名/発表者名
      吉元 照貴 , 西村 竜一 , 入野 俊夫 , 河原 英紀
    • 学会等名
      情報処理学会研究報告. [音楽情報科学]
    • 発表場所
      甲府
    • 年月日
      2015-03-02 – 2015-03-03
  • [学会発表] 声道形状と声帯音源特性を用いたグロウル系歌唱音声への実時間変換の提案2015

    • 著者名/発表者名
      溝渕 翔平 , 西村 竜一 , 入野 俊夫 , 河原 英紀
    • 学会等名
      情報処理学会研究報告. [音楽情報科学]
    • 発表場所
      甲府
    • 年月日
      2015-03-02 – 2015-03-03
  • [学会発表] Speech Analysis Modification and Synthesis tool STRAIGHT and extended voice morphing2015

    • 著者名/発表者名
      Hideki Kawahara
    • 学会等名
      ARO midwinter meeting
    • 発表場所
      Baltimore USA
    • 年月日
      2015-02-21 – 2015-02-25
    • 招待講演
  • [学会発表] Excitation source design for high-quality speech manipulation systems based on a temporally static group delay representation of periodic signals2014

    • 著者名/発表者名
      Hideki Kawahara, Masanori Morise, Ken-Ichi Sakakibara, Tomoki Toda, Hideki Banno Ryuichi Nisimura, Toshio Irino
    • 学会等名
      APSIPA ASC 2014
    • 発表場所
      Siem Reap, Cambodia
    • 年月日
      2014-12-09 – 2014-12-12
  • [学会発表] STRAIGHT speech analysis2014

    • 著者名/発表者名
      Hideki Kawahara
    • 学会等名
      Tutorial of APSIPA ASC 2014
    • 発表場所
      Siem Reap, Cambodia
    • 年月日
      2014-12-09 – 2014-12-12
    • 招待講演
  • [学会発表] 周期信号の静的表現に基づく音声処理2014

    • 著者名/発表者名
      河原 英紀
    • 学会等名
      電子情報通信学会技術研究報告(音声)
    • 発表場所
      白浜
    • 年月日
      2014-10-23 – 2014-10-24
    • 招待講演
  • [学会発表] Vocal tract length estimation based on vowels using a database consisting of 385 speakers and a database with MRI-based vocal tract shape information2014

    • 著者名/発表者名
      Hideki Kawahara, Tatsuya Kitamura, Hironori Takemoto, Ryuichi Nisimura, Toshio Irino
    • 学会等名
      Interspeech 2014
    • 発表場所
      Singapore
    • 年月日
      2014-09-14 – 2014-09-18
  • [学会発表] 線形予測分析を用いた声道断面積関数推定のための前処理について2014

    • 著者名/発表者名
      伊佐 衣代,西村 竜一,入野 俊夫,河原 英紀
    • 学会等名
      日本音響学会:秋季研究発表会講演論文集
    • 発表場所
      札幌
    • 年月日
      2014-09-03 – 2014-09-05
  • [学会発表] 声道形状と音源情報に注目した音声の好感度改善システムの検討について2014

    • 著者名/発表者名
      吉元 照貴,伊佐 衣代,溝渕 翔平,西村 竜一,入野 俊夫,河原 英紀
    • 学会等名
      日本音響学会:秋季研究発表会講演論文集
    • 発表場所
      札幌
    • 年月日
      2014-09-03 – 2014-09-05
  • [学会発表] Matlabのリアルタイム処理を利用した音声聴覚教育用ツールについて2014

    • 著者名/発表者名
      河原英紀
    • 学会等名
      日本音響学会:秋季研究発表会講演論文集
    • 発表場所
      札幌
    • 年月日
      2014-09-03 – 2014-09-05
  • [学会発表] 音声・聴覚の理解と信号処理2014

    • 著者名/発表者名
      河原 英紀
    • 学会等名
      音学シンポジウム
    • 発表場所
      日本大学、東京
    • 年月日
      2014-05-24 – 2014-05-25
    • 招待講演
  • [図書] Speech Prosody in Speech Synthesis: Modeling and generation of prosody for high quality and flexible speech synthesis2015

    • 著者名/発表者名
      Hideki Kawahara
    • 総ページ数
      213
    • 出版者
      Springer Berlin Heidelberg
  • [備考] Matlab realtime speech tools

    • URL

      http://www.wakayama-u.ac.jp/~kawahara/MatlabRealtimeSpeechTools/

  • [備考] 音声分析変換合成法STRAIGHT

    • URL

      http://www.wakayama-u.ac.jp/~kawahara/STRAIGHTadv/index_j.html

URL: 

公開日: 2016-05-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi