• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実施状況報告書

視覚障害者の映像鑑賞における音声合成利用の可能性と新展開

研究課題

研究課題/領域番号 17K01553
研究機関秋田大学

研究代表者

中島 佐和子  秋田大学, 理工学研究科, 助教 (40453542)

研究分担者 大河内 直之  東京大学, 先端科学技術研究センター, 特任研究員 (30361679)
水戸部 一孝  秋田大学, 理工学研究科, 教授 (60282159)
研究期間 (年度) 2017-04-01 – 2020-03-31
キーワードバリアフリー / 視覚障害者 / 音声ガイド / 音声合成 / 映画・映像 / メディア / ポーズ
研究実績の概要

初年度は、研究開発の要点を得るために、視覚障害者および映画製作者や音声ガイド制作者へのヒヤリングからスタートした。視覚障害者を対象に合成音声とナレーターによる肉声の音声ガイド(本編音を含まない)の聞き取り実験を実施したところ、音声ガイドにおけるポーズ(無音区間)長の重要性が指摘された。また、映画製作者と音声ガイド制作者へのヒヤリングから、従来の音声ガイド台本では音声ガイド提示タイミングは1秒刻みで設定されており(調査を継続中)、映画の本編音(セリフ、環境音、音楽など)や登場人物の行動や場面展開に合わせた微妙な音声ガイド提示タイミングの調整はナレーターが担ってきたことがわかった。音声合成を用いた音声ガイド制作においては、質の確保や向上だけでなく、時間的また金銭的なコスト削減の視点も忘れてはならない。音声ガイド提示タイミングの調整をナレーターに頼れない分、音声ガイド台本制作時やスタジオ調整時にいかにスムーズにタイミング調整を行えるかは重要な課題と考えた。そこで若年晴眼者を対象とした予備実験により、合成音声と肉声を用いて、セリフや環境音の発生と音声ガイド提示の時間差を-2秒から+2秒の間で5条件設定し、聞きやすさや状況のイメージし易さなどの観点から音声ガイド提示タイミングの最適値を評価した。実際の映画館での映画鑑賞状況を想定して映画本編音はスピーカーから音声ガイドはイヤホンから提示し、セリフおよび環境音と音声ガイド1文からなる短い提示条件(6から8秒)で評価した。結果、本条件では必ずしも肉声の評価が合成音声の評価を上回る訳ではなく、合成音声と肉声とで最適な音声ガイド提示タイミングが異なった。そこで後半では、音声ガイドの提示タイミングの設定や調整を研究開発の重要項目の一つと定め、音声合成を用いた音声ガイド制作ソフトを試作し、音声ガイド制作者と視覚障害者による評価実験の準備を進めた。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

初年度の研究計画のうち、合成音声と肉声に対する認知特性の違いを活かした『合成音声を用いた音声ガイド提示手法』と『音声合成を用いた音声ガイド制作支援システム』の検討については、視覚障害者および映画製作者や音声ガイド制作者に対する聞き取り調査や評価、および、若年晴眼者を対象とした予備実験を通じて、開発要素を定量的に検討することができた。そのうち『音声合成を用いた音声ガイド制作支援システム』については試作に至り、スムーズに“視覚障害者の聴覚特性を活かした音声合成による映画鑑賞支援システムの開発”の準備を進めることができたと考える。

今後の研究の推進方策

初年度に試作した『音声合成を用いた音声ガイド制作支援システム』を実際の音声ガイド制作に用いることで、音声ガイド提示タイミングの決定や調整における課題と改善策をメインに制作フロー全体への影響も踏まえ、合成音声の利用による効果や具体的課題を得る。その上で、視覚障害者を対象とした合成音声と肉声の聞き取り実験により、開発要素を絞り込む。これにより、合成音声でも聞きやすい音声ガイドの開発方法を定める予定である。

次年度使用額が生じた理由

初年度はソフトの試作や若年晴眼者を対象とした予備実験に重点を置いたため、初年度に予定していた視覚障害者を対象とした実験を次年度に移行した。また、『音声合成を用いた音声ガイド制作支援システム』の試作準備として予定していた支出も、初年度終了時までは、PCやソフトウェア購入や開発の外部委託に際する大きな出費の必要が生じなかった。そのため次年度使用額が生じた。なお、それらについては次年度の早い段階で使用する予定である。

  • 研究成果

    (4件)

すべて 2017

すべて 雑誌論文 (2件) (うち査読あり 1件) 学会発表 (2件) (うち国際学会 1件)

  • [雑誌論文] Preliminary Study on Auditory Perception of Multiple Speech Synthesis with Different Speech Rates to Help Visually Impaired Persons Enjoy Movies2017

    • 著者名/発表者名
      Sawako Nakajima, Naoyuki Okochi, Kazutaka Mitobe and Tetsujiro Yamagami
    • 雑誌名

      The Proceedings of the 8th International Conference on Materials Engineering for Resources (ICMR2017)

      巻: - ページ: 415-418

    • 査読あり
  • [雑誌論文] 視覚障害者の映画鑑賞支援を目的とした合成音声による音声ガイドの提示タイミングと心理的作用の評価2017

    • 著者名/発表者名
      佐々木 怜衣 , 中島 佐和子 , 髙橋 壱成 , 大河内 直之 , 山上 徹二郎 , 水戸部 一孝
    • 雑誌名

      電子情報通信学会技術研究報告 (IEICE technical report : 信学技報)

      巻: 117(502) ページ: 103-107

  • [学会発表] Preliminary Study on Auditory Perception of Multiple Speech Synthesis with Different Speech Rates to Help Visually Impaired Persons Enjoy Movies2017

    • 著者名/発表者名
      Sawako Nakajima, Naoyuki Okochi, Kazutaka Mitobe and Tetsujiro Yamagami
    • 学会等名
      The 8th International Conference on Materials Engineering for Resources (ICMR2017)
    • 国際学会
  • [学会発表] 視覚障害者の映画鑑賞支援を目的とした合成音声による音声ガイドの提示タイミングと心理的作用の評価2017

    • 著者名/発表者名
      佐々木 怜衣 , 中島 佐和子 , 髙橋 壱成 , 大河内 直之 , 山上 徹二郎 , 水戸部 一孝
    • 学会等名
      第94回福祉情報工学研究会(WIT)

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi