• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実施状況報告書

機能性音声のデザイン方法論の研究

研究課題

研究課題/領域番号 24650085
研究機関和歌山大学

研究代表者

河原 英紀  和歌山大学, システム工学部, 教授 (40294300)

研究分担者 森勢 将雅  山梨大学, 大学院医学工学総合研究部, 助教 (60510013)
研究期間 (年度) 2012-04-01 – 2014-03-31
キーワード音声分析 / 音声変換 / 主観評価実験 / 脳活動 / 潜在知覚 / モーフィング / 一般化線形モデル
研究概要

自然な文字である手書き文字よりも、適切にデザインされた活字は遥かに読み易い。音声言語も、 適切にデザインすることにより、自然な肉声そのままのものよりも、明瞭に聴き取ることができ、内 容を良く理解し記憶でき、より深い感動を得、心の平安を得、警戒心を喚起できるなど、用途に応じ たものとすることができる可能性がある。本研究課題は、最新の音声変換技術、合成技術を利用する ことにより、そのような用途に応じた機能を有する音声をデザインするための方法論を明らかにする ことを目的とする。研究の基盤としては、申請者が開発しており、現在、音声知覚および音声合成研 究のデファクトスタンダードとなっている STRAIGHT を必要に応じて拡張して用いる。この計画に基づき、初年度は研究環境としてのツール群の整備と手法の構築、素材のスクリーニング、対話的操作環境の構築を開始した。この過程で、大量の音声の分析に必要となる、高精度かつ高速の基本周波数分析法を発明した。また、これまで安定な分析が困難であった群遅延の安定化に成功した。さらに、中核的研究手段であるSTRAIGHTの処理内容を見直し、合成部分の実装を時変フィルタとして明確化するとともに、汎用性の高い関数ポインタを用いた構造とした。これらを用いて様々な操作を行い、知覚との関連を研究を進めた。その過程で、聴覚心理実験を、これまでの統計的手法を見通し良く包含することのできる一般化線形モデルに適した実験用ユーザインタフェースを開発することにより、効率よく遂行し分析できる環境を整備した。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

画期的なアルゴリズムの発明により、当初想定していた範囲を含み、大きく内容を拡充できる見通しが生まれた。また、聴覚心理実験用のGUIと実験手法を並行して開発することにより、当初の想定以上に研究手段とその応用の内容を深めることができた。これは、次年度に向けての準備として期待した以上のものであり、大きな発展につながるものである。

今後の研究の推進方策

初年度に高度なレベルに達した準備状況を活用して、新しく構築した対話的操作環境を用い、実際に強い印象を与える音声間のモーフィングを利用するこ とにより、用途に応じた機能を有する音声のデザイン事例を蓄積する。このデザイン事例のログから 共通するパターンを抽出し、デザイン方法論の作業仮説を形成し、目標とする以下の二種類の音声へ の変換と聴取実験を行なう。それらは、(1) 警戒心を喚起する音声、および (2) 安心感を促進する音 声である。この評価に際し、初年度の (1) において構築した試験システムと、実験と並行して行なう NIRS および脳波計を用いた非侵襲的脳活動観測により、目的の一つである、(3) 前意識的影響を定量 化する実験手法および音声加工ツールの検証を行なう。

次年度の研究費の使用計画

研究分担者が年度内(2月)に旧所属の立命館大学より現所属の山梨大学に異動したため、昨年度末に予定していた音声収録用の機材の購入と素材の追加収録とスクリーニングなどの研究計画を、次年度に遂行することとした。この変更は、計画を遅延させるものではなく、達成度で説明した画期的案アルゴリズムの周辺を、和歌山大学で固めるための時間の余裕を生むことにつながり、むしろ計画をバランス良く推進する上で有益である。

  • 研究成果

    (6件)

すべて 2012

すべて 学会発表 (6件)

  • [学会発表] Modulation transfer function design for a flexible cross synthesis VOCODER based on F0 adaptive spectral envelope recovery2012

    • 著者名/発表者名
      Taiki Nishi, Ryuichi Nisimura, Toshio Irino, Hideki Kawahara
    • 学会等名
      Proc. APSIPA
    • 発表場所
      Calfornia, USA
    • 年月日
      20121206-20121206
  • [学会発表] An interference-free representation of group delay for periodic signals2012

    • 著者名/発表者名
      Hideki Kawahara, Masanori Morise, Ryuichi Nisimura and Toshio Irino
    • 学会等名
      Proc. APSIPA
    • 発表場所
      Calfornia, USA
    • 年月日
      20121204-20121204
  • [学会発表] Deviation measure of waveform symmetry and its application to high-speed and temporally-fine F0 extraction for vocal sound texture manipulation2012

    • 著者名/発表者名
      Hideki Kawahara, Masanori Morise, Ryuichi Nisimura, Toshio Irino
    • 学会等名
      Interspeech2012
    • 発表場所
      Portland, USA
    • 年月日
      20120910-20120910
  • [学会発表] Inharmonic Speech: A Tool for the Study of Speech Perception and Separatio2012

    • 著者名/発表者名
      Josh H. McDermott, Daniel P. W. Ellis and Hideki Kawahara
    • 学会等名
      SAPA-Scale Conference 2012
    • 発表場所
      Portland, USA
    • 年月日
      20120909-20120909
  • [学会発表] 楽器音や動物の鳴声の音色と音声の言語情報を保持したクロス合成VOCODER2012

    • 著者名/発表者名
      西大輝, 西村竜一, 入野俊夫, 河原英紀
    • 学会等名
      情報処理学会第95回音楽情報科学研究会
    • 発表場所
      東京大学、東京
    • 年月日
      20120602-20120602
  • [学会発表] 音源およびスペクトル包絡の時間的微細構造の加工と歌唱音声の印象への影響について2012

    • 著者名/発表者名
      河原英紀,森勢将雅,西村竜一,入野俊夫
    • 学会等名
      情報処理学会第95回音楽情報科学研究会
    • 発表場所
      東京大学、東京
    • 年月日
      20120602-20120602

URL: 

公開日: 2014-07-24  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi