• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

話者の映像及び話声の性質が高精度高感性音声提示システムに与える影響

研究課題

研究課題/領域番号 17700223
研究種目

若手研究(B)

配分区分補助金
研究分野 感性情報学・ソフトコンピューティング
研究機関東北大学

研究代表者

坂本 修一  東北大学, 電気通信研究所, 助手 (60332524)

研究期間 (年度) 2005 – 2006
研究課題ステータス 完了 (2006年度)
配分額 *注記
3,300千円 (直接経費: 3,300千円)
2006年度: 1,200千円 (直接経費: 1,200千円)
2005年度: 2,100千円 (直接経費: 2,100千円)
キーワードマルチモーダル情報処理 / 視聴覚統合 / 音声知覚 / 話速変換音声 / 音声伸長 / 単語了解度 / 読唇 / 高齢者
研究概要

本研究の目的は,話者映像の有無や,ピッチ,話速といった話声の性質,話者映像と話声の同期,話者の口の動きといったパラメータが,音韻知覚及び視聴者の感性情報にどのような影響を及ぼすか定量的に明らかにし,得られた知見に基づいて,高感性音声提示システムの構築法を検討することである.
今年度は昨年度と同様に音声の話速に注目し,話速を遅らせることで時間長を伸長した音声と通常速度の話者映像との組み合わせが,文章了解度にどのような影響を及ぼすかを検討した.あわせて,単語刺激を用いて話者映像と伸長音声を組み合わせた際の映像と音声のズレの検知限,許容限を心理実験により求め,両者の関係を分析した.まず,文章了解度試験を行ったところ,音声伸長量が200ms以内であれば,話者映像と音声の間にズレが生じていても,話者映像を付加することによる文章了解度の向上が見込めるという結果が得られた.この結果は,昨年度単語を用いて得られた結果と同様であり,音声伸長量を200ms以内に設定すれば,話者映像が音韻知覚を促進するということを示している.一方,伸長音声と通常速度の話者映像を用いて話者映像と音声とのズレの検知限を求めたところ,約230msが検知限となることが示された.また,ズレの許容限は約340msであった.
これらの結果と,昨年度得られた単語了解度の結果を総合すると,話者映像と音声のズレが検知できない範囲であれば,話者映像が音韻知覚の向上に寄与するということが示唆される.逆に言うと,話者映像と音声のズレの検知といった感性情報が音声知覚に負の影響を及ぼしているといえよう.これらの知見は,高感性音声提示システムを構築する上での指針となり得る極めて重要な知見であると思われる.

報告書

(2件)
  • 2006 実績報告書
  • 2005 実績報告書
  • 研究成果

    (2件)

すべて 2006

すべて 雑誌論文 (2件)

  • [雑誌論文] 視聴覚の提示タイミングおよび提示速度の違いが単語音声認知に及ぼす影響2006

    • 著者名/発表者名
      田中章浩
    • 雑誌名

      日本音響学会聴覚研究会資料 H-2006-67

      ページ: 369-374

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 単語音声と話者映像のずれが視聴覚統合に及ぼす影響2006

    • 著者名/発表者名
      津村光美
    • 雑誌名

      日本音響学会講演論文集 3-P-9

      ページ: 467-468

    • 関連する報告書
      2005 実績報告書

URL: 

公開日: 2005-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi