• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

能動的知覚モデルに基づく歌唱レンダリングシステム作成に関する研究

研究課題

研究課題/領域番号 14380165
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関和歌山大学

研究代表者

河原 英紀  和歌山大学, システム工学部, 教授 (40294300)

研究分担者 片寄 晴弘  関西学院大学, 理工学部, 教授 (70294303)
西浦 敬信  立命館大学, 情報理工学部, 助教授 (70343275)
坂野 秀樹  和歌山大学, システム工学部, 助手 (20335003)
西村 竜一  和歌山大学, システム工学部, 助手 (00379611)
高橋 徹  和歌山大学, システム工学部, 研究員
研究期間 (年度) 2002 – 2004
研究課題ステータス 完了 (2004年度)
配分額 *注記
14,300千円 (直接経費: 14,300千円)
2004年度: 4,200千円 (直接経費: 4,200千円)
2003年度: 6,300千円 (直接経費: 6,300千円)
2002年度: 3,800千円 (直接経費: 3,800千円)
キーワード音声分析 / 音声合成 / 聴覚的モーフィング / 基本周波数 / 放射特性 / パラ言語情報 / 合成歌唱 / 音声の動特性 / 高品質音声合成 / 歌唱システム / STRAIGHT / 音声変換 / ビブラート / 表情づけ / 非言語情報 / モーフィング / 韻律情報 / 聴覚フィードバック / 変換聴覚フィードバック
研究概要

本研究の目的は、スキャットやヴォカリーズのように歌詞のない歌唱音声を対象とすることにより、音声の非言語的側面に起因する歌唱の魅力を明らかにするとともに、その成果に基づいて制作した合成歌唱作品を国際的なコンテストで入賞させることにあった。また、その過程において、音声の非言語的側面の研究のための、新しいツールや研究手法を構築することも併せて狙っていた。これらの目標は、国際会議NIME'04に併設されたコンピュータ音楽システムの聞き比べコンテストにおいて、本研究計画の中核として開発されたSTRAIGHTに基づく合成歌唱が、参加した合成歌唱中での一位と評価されたこと、高品質の音声モーフィング技術を発明したこと、さらに歌唱の魅力の一つであるビブラートが音声モーフィングに与える問題点を解明し対策を明らかにしたこと、それらを用いて提案した組織的ダウングレードに基づく研究戦略を実際に遂行して問題点を明らかにしたことなどを考慮すると、高いレベルで達成することができたと言える。これらの成果を国内外の論文/国際会議/研究会/大会等で報告するとともに、開発したプログラムを研究コミュニティーに対して提供することにより、一つの研究動向を生み出した。しかし、これらの成果を併せても、歌詞を伴った実際の歌唱の魅力を工学的に再現し制御することのできる技術レベルには遠く及ばないことも明らかである。組織的ダウングレード戦略の前提である「十分に密に分布した実例」を、歌唱音声について用意することは物理的/生理的制約により現実的には不可能であることも明らかとなった。この先、実際の歌唱の魅力に迫る研究を進めるためには、少数の事例から汎化可能な変換関数を構成するための方法論の確立が必須である。

報告書

(4件)
  • 2004 実績報告書   研究成果報告書概要
  • 2003 実績報告書
  • 2002 実績報告書
  • 研究成果

    (57件)

すべて 2005 2004 2003 2002 その他

すべて 雑誌論文 (44件) 図書 (1件) 文献書誌 (12件)

  • [雑誌論文] The processing and perception of size information in speech sounds2005

    • 著者名/発表者名
      David R.R.Smith
    • 雑誌名

      the Journal of the Acoustical Society of America 117・1

      ページ: 305-318

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 実績報告書 2004 研究成果報告書概要
  • [雑誌論文] Underlying principles of a high-quality speech manipulation system STRAIGHT and its application to speech segregation2005

    • 著者名/発表者名
      Hideki Kawahara
    • 雑誌名

      Speech separation by human and machines

      ページ: 167-180

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Speech segregation using an event-synchronous auditory image and STRAIGHT2005

    • 著者名/発表者名
      Toshio Irino
    • 雑誌名

      Speech separation by human and machines

      ページ: 151-162

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] The processing and perception of size information in speech sounds2005

    • 著者名/発表者名
      David R.R.Smith
    • 雑誌名

      the Journal of the Acoustical Society of America Vol.117, No.1

      ページ: 305-318

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] "senza vibrato" : a key component for morphing singing2004

    • 著者名/発表者名
      Hideki Kawahara
    • 雑誌名

      Proc.8th International Conference on Spoken Language Processing (ICSLP 2004) V

      ページ: 934-937

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Intelligibility of degraded speech from smeared STRAIGHT spectrum2004

    • 著者名/発表者名
      Jiang Jin
    • 雑誌名

      Proc.8th International Conference on Spoken Language Processing (ICSLP 2004) IV

      ページ: 530-533

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Loudspeaker equalization based on multi-location observation with reliable time-frequency region selection and its evaluation using sound propagation measurement2004

    • 著者名/発表者名
      Masanori Morise
    • 雑誌名

      Proc.12th European Signal Processing Conference (EUSIPCO 2004)

      ページ: 1995-1998

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Acappella synthesis demonstrations using RWC music database2004

    • 著者名/発表者名
      Hideki Kawahara
    • 雑誌名

      Proc.International Conference on New Interfaces for Musical Expression (NIMEO4)

      ページ: 130-131

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Algorithm amalgam : Morphing waveform based methods, sinuisoidal models and STRAIGHT2004

    • 著者名/発表者名
      Hideki Kawahara
    • 雑誌名

      Proc.2004 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2004) I

      ページ: 13-16

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Computational basis of illusionary pitch perception2004

    • 著者名/発表者名
      Hideki Kawahara
    • 雑誌名

      Proc.18th International Congress on Acoustics (ICA 2004) II

      ページ: 1081-1084

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] A new acoustic measurement and compensation method based on logarithmic transformation of the time axis and multi-location acquisition2004

    • 著者名/発表者名
      Masanori Morise
    • 雑誌名

      Proc.18th International Congress on Acoustics (ICA 2004) I

      ページ: 721-724

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Effects of group delay diffusion in pulse trains on timbre : a periodicity cue in auditory images2004

    • 著者名/発表者名
      Minoru Tsuzaki
    • 雑誌名

      Proc.18th International Congress on Acoustics (ICA 2004) II

      ページ: 1803-1806

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Speech segregation using an auditory vocoder with event-synchronous enhancement2004

    • 著者名/発表者名
      Toshio Irino
    • 雑誌名

      Proc.18th International Congress on Acoustics (ICA 2004) IV

      ページ: 3025-3028

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] "senza vibrato" : a key component for morphing singing2004

    • 著者名/発表者名
      Hideki Kawahara
    • 雑誌名

      Proc.8th International Conference on Spoken Language Processing (ICSLP 2004) vol.V

      ページ: 934-937

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Intelligibility of degraded speech from smeared STRAIGHT spectrum2004

    • 著者名/発表者名
      Jiang Jin
    • 雑誌名

      Proc.8th International Conference on Spoken Language Processing (ICSLP 2004) vol.IV

      ページ: 530-533

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Acappella synthesis demonstrations using RWC music database2004

    • 著者名/発表者名
      Hideki Kawahara
    • 雑誌名

      Proc.International Conference on New Interfaces for Musical Expression (NIME04)

      ページ: 130-131

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Algorithm amalgam : Morphing waveform based methods, sinuisoidal models and STRAIGHT2004

    • 著者名/発表者名
      Hideki Kawahara
    • 雑誌名

      Proc.2004 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2004) vol.I

      ページ: 13-16

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Computational basis of illusionary pitch perception2004

    • 著者名/発表者名
      Hideki Kawahara
    • 雑誌名

      Proc.18th International Congress on Acoustics (ICA 2004) vol.II

      ページ: 1081-1084

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] A new acoustic measurement and compensation method based on logarithmic transformation of the time axis and multi-location acquisition2004

    • 著者名/発表者名
      Masanori Morise
    • 雑誌名

      Proc.18th International Congress on Acoustics (ICA 2004) vol.I

      ページ: 721-724

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Effects of group delay diffusion in pulse trains on timbre : a periodicity cue in auditory images2004

    • 著者名/発表者名
      Minoru Tsuzaki
    • 雑誌名

      Proc.18th International Congress on Acoustics (ICA 2004) vol.II

      ページ: 1803-1806

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Speech segregation using an auditory vocoder with event-synchronous enhancement2004

    • 著者名/発表者名
      Toshio Irino
    • 雑誌名

      Proc.18th International Congress on Acoustics (ICA 2004) vol.IV

      ページ: 3025-3028

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] "senza vibrato": a key component for morphing singing2004

    • 著者名/発表者名
      Hideki Kawahara
    • 雑誌名

      Proc.ICSLP 2004 V

      ページ: 934-937

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Acappella synthesis demonstrations using RWC music database2004

    • 著者名/発表者名
      Hideki Kawahara
    • 雑誌名

      Proc.NIME' 04 I

      ページ: 130-131

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Algorithm AMALGAN : Morphing waveform based methods, sinusoidal models and STRAIGHT2004

    • 著者名/発表者名
      Hideki Kawahara
    • 雑誌名

      Proc.ICASSP2004 I

      ページ: 13-16

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 聴覚フィードバックの発声への影響-ヒトは自分の話声を聞いているのか?2003

    • 著者名/発表者名
      河原英紀
    • 雑誌名

      日本音響学会誌 59・11

      ページ: 670-675

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] 発話時の頭部周辺での音声の伝達特性について2003

    • 著者名/発表者名
      貫名真澄
    • 雑誌名

      日本音響学会誌 59・5

      ページ: 256-260

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Exemplar-based voice quality analysis and control using a high quality auditory morphing procedure based on STRAIGHT2003

    • 著者名/発表者名
      Hideki Kawahara
    • 雑誌名

      Proc.Voice Quality : Functions, Analysis and Synthesis (VOQUAL'03), International Speech Communication Association Tutorial and Research Workshop

      ページ: 109-114

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Speech segregation based on fundamental event information using an auditory VOCODER2003

    • 著者名/発表者名
      Toshio Irino
    • 雑誌名

      Proc.8th European Conference on Speech Communication and Technology (Eurospeech'03)

      ページ: 553-556

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Investigation of emotionally morphed speech perception and its structure using a high quality speech manipulation System2003

    • 著者名/発表者名
      Hisami Matsui
    • 雑誌名

      Proc.8th European Conference on Speech Communication and Technology (Eurospeech'03)

      ページ: 2113-2116

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Glottal closure instant synchronous sinusoidal model for high quality speech analysis/synthesis2003

    • 著者名/発表者名
      Parham Zolfaghari
    • 雑誌名

      Proc.8th European Conference on Speech Communication and Technology (Eurospeech'03)

      ページ: 2441-2444

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Influence of recording equipment on the identification of second language phoneme contrasts2003

    • 著者名/発表者名
      Hiroaki Kato
    • 雑誌名

      Proc.8th European Conference on Speech Communication and Technology (Eurospeech'03)

      ページ: 3157-3160

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Psychological evaluation of emotional speech using a new morphing method2003

    • 著者名/発表者名
      Yuko Sogabe
    • 雑誌名

      Proc.4th International Conference on Cognitive Science (ICCS) 2

      ページ: 628-633

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Auditory morphing based on an elastic perceptual distance metric in an interference-free time-frequency representation2003

    • 著者名/発表者名
      Hideki Kawahara
    • 雑誌名

      Proc.2003 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2003) I

      ページ: 256-259

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Speech segregation using event synchronous auditory VOCODER2003

    • 著者名/発表者名
      Toshio Irino
    • 雑誌名

      Proc.2003 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2003) V

      ページ: 525-528

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Auditory feedback effects on speech production : Are humans listening to their own speech?2003

    • 著者名/発表者名
      Hideki Kawahara
    • 雑誌名

      the Journal of the Acoustical Society of Japan Vol.59, No.11

      ページ: 670-675

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Transfer characteristics of speech sounds around speaker's head2003

    • 著者名/発表者名
      Masumi Nukina
    • 雑誌名

      the Journal of the Acoustical Society of Japan Vol.59, No.5

      ページ: 256-260

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Speech segregation based on fundamental event information using an auditory VOCODER2003

    • 著者名/発表者名
      Toshio Irino
    • 雑誌名

      Proc.8th European Conference on Speech Communication and Technology (Eurospeech '03)

      ページ: 553-556

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Investigation of emotionally morphed speech perception and its structure using a high quality speech manipulation System2003

    • 著者名/発表者名
      Hisami Matsui
    • 雑誌名

      Proc.8th European Conference on Speech Communication and Technology (Eurospeech '03)

      ページ: 2113-2116

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Influence of recording equipment on the identification of second language phoneme contrasts2003

    • 著者名/発表者名
      Hiroaki Kato
    • 雑誌名

      Proc.8th European Conference on Speech Communication and Technology (Eurospeech '03)

      ページ: 3157-3160

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Psychological evaluation of emotional speech using a new morphing method2003

    • 著者名/発表者名
      Yuko Sogabe
    • 雑誌名

      Proc.4th International Conference on Cognitive Science (ICCS) vol.2

      ページ: 628-633

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Auditory morphing based on an elastic perceptual distance metric in an interference-free time-frequency representation2003

    • 著者名/発表者名
      Hideki Kawahara
    • 雑誌名

      Proc.2003 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2003) vol.I

      ページ: 256-259

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] Speech segregation using event synchronous auditory VOCODER2003

    • 著者名/発表者名
      Toshio Irino
    • 雑誌名

      Proc.2003 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2003) vol.V

      ページ: 525-528

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] On F0 trajectory for very high-quality speech manipulation2002

    • 著者名/発表者名
      Hideki Kawahara
    • 雑誌名

      Proc.7th International Conference on Spoken Language Processing (ICSLP2002)

      ページ: 2397-2400

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [雑誌論文] On F0 trajectory for very high-quality speech manipulation2002

    • 著者名/発表者名
      Hideki Kawahara
    • 雑誌名

      Proc.7th International Conference on Spoken Language Processing (ICSLP 2002)

      ページ: 2397-2400

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2004 研究成果報告書概要
  • [図書] Speech separation by human and machines2004

    • 著者名/発表者名
      Pierre Divenyi
    • 総ページ数
      319
    • 出版者
      Kluwer Academic Pub.
    • 関連する報告書
      2004 実績報告書
  • [文献書誌] 貫名真澄, 河原英紀: "発話時の頭部周辺での音声の伝達特性について"日本音響学会誌. Vol.59,No.5. 256-260 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Hisami Matsui, Hideki Kawahara: "Investigation of Emotionally Morphed Speech Perception and its Structure Using a High Quality Speech Manipulation System Prod"Eurospeech'03. 2113-2116 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Hideki Kawahara: "Exemplar-based Voice Quality Analysis and Control using a High Quality Auditory Morphing Procedure based on STRAIGHT"VOQUAL'03, ISCA Tutorial and Research Workshop. 109-114 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Hideki Kawahara, Hisami Matsui: "AUDITORY MORPHING BASED ON AN ELASTIC PERCEPTUAL DISTANCE METRIC IN AN INTERFERENCE-FREE TIME-FREQUENCY REPRESENTATION"ICASSP'2003. 6-10 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Ryuichirou Yanaga, Hideki Kawahara: "Logarithmic temporal axis manipulation and its application for measuring auditory contributions in FO control using a transformed auditory feedback procedure"J.Acoust.Soc.Am.. 114. 2458-2458 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Hideki Kawahara, Hideki Banno, Toshio Irino, Parham Zolfaghari: "ALGORITHM AMALGAM : MORPHING WAVEFORM BASED METHODS, SINUISOIDAL MODELS AND STRAIGHT"Proc.ICASSP'2004. (採録決定). (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Hideki Kawahara: "Systematic Downgrading for Investigating "Naturaless" in Synthesized singing using STRAIGHT : A High Quality VOCODER"143th MEETING OF THE ACOUSTICAL SOCIETY OF AMERICA. Vol.111, No.5, Pt.2. 2334-2334 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Hideki Kawahara, Parham Zolfaghari, Alain de Cheveigne: "ON F0 TRAJECTORY OPTIMIZATION FOR VERY HIGH-QUALITY SPEECH MANIPULATION"Proceedings of JCSLP 2002. Volume4. 2397-2400 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Masumi Nukina, Hideki Kawahara: "Cross spectral measurement of head related speech transfer functions using speaker's own voice"The Journal of the Acoustical Society of America. Volume112, Issue5. 2324-2324 (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Hisami Matsui, Hideki Kawahara: "Auditorily motivated elastic spectral distance and its application to emotional morphing of portrayal speech"The Journal of the Acoustical Society of America. Volume112, Issue5. 2323-2323 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Hideki Kawahara, Hisami Matsui: "Auditory morphing based on an elastic perceptual distance metric in an interference free time-frequency representation"Proceedings of ICASSP 2003. Vol.1. 256-259 (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 貫名真澄, 河原英紀: "発話時の頭部周辺での音声の伝達特性について"日本音響学会誌. Vol.59, no.5. 256-260 (2003)

    • 関連する報告書
      2002 実績報告書

URL: 

公開日: 2002-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi