デジタル圧縮・再生映像の話者映像効果における感性因子の研究

研究課題

研究課題/領域番号	09838020
研究種目	基盤研究(C)
配分区分	補助金
応募区分	一般
研究分野	感性工学
研究機関	京都工芸繊維大学
研究代表者	田村博京都工芸繊維大学, 大学院・工芸科学研究科, 教授 (70029411)
研究分担者	渋谷雄京都工芸繊維大学, 工芸学部, 助教授 (70226190)
研究期間 (年度)	1997 – 1998
研究課題ステータス	完了 (1998年度)
配分額 *注記	3,000千円 (直接経費: 3,000千円) 1998年度: 900千円 (直接経費: 900千円) 1997年度: 2,100千円 (直接経費: 2,100千円)
キーワード	話者映像効果 / 劣勢音声識別実験法 / MPEG / 誤答分析 / 異聴 / 低速効果 / 高速効果 / 感性 / ISDN / 感性因子 / 劣性音声 / 左右音声 / 混合音声 / デジタル圧縮・再生
研究概要	代表的デジタル圧縮手法であるMPEG-1により圧縮した話者映像を用いて,ビットレート(400kbps,4000kbps)および話者映像の撮影向き(正面映像と側面映像)が映像の提示効果に与える影響について,劣性音声識別実験法により実験・検討した.その結果, (i) 話者映像効果,誤答分析,子音異聴の観点からは,400kbpsと4000kbpsの試料の間には明確な差異がない. (ii) 唇音において側面映像の話者映像効果が正面映像よりも有意に高い. という結果を得た.上記(i)の理由としては,提示した映像の冗長性の高さが考えられる.提示映像がブルーバックを背景とした話者映像であったため,映像全体としては動的要素が少なかった.従って,空間的・時間的冗長性が高く,MPEG-1において効率的に圧縮できる映像であったといえる.このため,400kbitsという低ビットレートでも圧縮時の情報の欠落が少なく,結果としてビットレート間での差異が明確に見られなかったと考えられる. そこで,空間的・時間的冗長性のより低い話者映像の一例として,CG映像と先の話者正面映像をクロマキー合成して提示映像資料とし,これを400kbpsおよび4000kbpsでMPEG-1圧縮し,同様の実験を行った.その結果,話者の口形によってもたらされる低速効果が,400kbpsでは4000kbpsに比べて有意に低くなることを示した. 今後は,MPEGエンコードにおけるオーディオ関連パラメータを変化させた場合に,話者映像効果の発現の違いを明らかにしていく.また,今後のマルチメディアコンテンツにおいては,視覚的な効果を目的として,話者の背景に様々なCG等が合成されることが予想される.そこで,話者背景としてのCGの空間的・時間的冗長性のパラメータを様々に変化させた話者映像についても吟味,比較の必要があると考える.

報告書

(3件)

1998 実績報告書研究成果報告書概要
1997 実績報告書

研究成果
(14件)

すべてその他

すべて文献書誌 (14件)

[文献書誌] 呉俊: "音声識別における顔映像の役割" 電子情報通信学会論文誌. J80-D-II・8. 2066-2073 (1997)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1998 研究成果報告書概要
[文献書誌] 都築達郎: "単語音声識別における静止映像の提示効果" Human Interface. 13. 457-462 (1997)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1998 研究成果報告書概要
[文献書誌] 古江伸樹: "劣性音声識別実験法を用いたMPEG-1映像の品質評価" Human Interface. 14. 565-570 (1998)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1998 研究成果報告書概要
[文献書誌] 都築達郎: "MPEG-1圧縮した正面映像と側面映像の話者映像効果の比較" 日本人間工学会関西支部大会講演論文集. 93-98 (1998)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1998 研究成果報告書概要
[文献書誌] Jun WU: "On the Roles of Talking Face in Speech Perception" Trans.IEICE. vol.J80-D-II. 2066-2073 (1997)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1998 研究成果報告書概要
[文献書誌] Tatsurou TSUZUKI: "Still Image Effect in Speech Word Recognition" Human Interface. vol.13. 457-462 (1997)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1998 研究成果報告書概要
[文献書誌] Nobuki FURUE: "Evaluation of MPEG-1 Video by Means of Inferior Speech Recognition" Human Interface. vol.14. 565-570 (1998)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1998 研究成果報告書概要
[文献書誌] Tatsuro TSUZUKI: "A Comparison of Talking Image Effect of front and profile face image compressed by MPEG-1 format" Proc.Conference of Kansai Chapter, Japan Ergonomics Society. 93-98 (1998)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1998 研究成果報告書概要
[文献書誌] 呉俊: "音声識別における顔映像の役割" 電子情報通信学会論文誌. J80-D-II・8. 2066-2073 (1997)
- 関連する報告書
  1998 実績報告書
[文献書誌] 都築達郎: "単語音声識別における静止映像の提示効果" Human Interface. 13. 457-462 (1997)
- 関連する報告書
  1998 実績報告書
[文献書誌] 古江伸樹: "劣性音声識別実験法を用いたMPEG-1映像の品質評価" Human Interface. 14. 565-570 (1998)
- 関連する報告書
  1998 実績報告書
[文献書誌] 都築達郎: "MPEG-1圧縮した正面映像と側面映像の話者映像効果の比較" 日本人間工学会関西支部大会講演論文集. 93-98 (1998)
- 関連する報告書
  1998 実績報告書
[文献書誌] 呉俊: "音声識別における顔映像の役割" 電子情報通信学会論文誌. VOL.J80. 2066-2073 (1997)
- 関連する報告書
  1997 実績報告書
[文献書誌] 都築達郎: "単語音声識別における静止映像の提示効果" ヒューマン・インタフェース・シンポジウム論文集. 第13回. 457-462 (1997)
- 関連する報告書
  1997 実績報告書

デジタル圧縮・再生映像の話者映像効果における感性因子の研究

研究代表者

田村 博 京都工芸繊維大学, 大学院・工芸科学研究科, 教授 (70029411)

3,000千円 (直接経費: 3,000千円)

報告書

研究成果

[文献書誌] 呉 俊: "音声識別における顔映像の役割" 電子情報通信学会論文誌. J80-D-II・8. 2066-2073 (1997)

説明

関連する報告書

[文献書誌] 都築 達郎: "単語音声識別における静止映像の提示効果" Human Interface. 13. 457-462 (1997)

説明

関連する報告書

[文献書誌] 古江 伸樹: "劣性音声識別実験法を用いたMPEG-1映像の品質評価" Human Interface. 14. 565-570 (1998)

説明

関連する報告書

[文献書誌] 都築 達郎: "MPEG-1圧縮した正面映像と側面映像の話者映像効果の比較" 日本人間工学会関西支部大会講演論文集. 93-98 (1998)

説明

関連する報告書

[文献書誌] Jun WU: "On the Roles of Talking Face in Speech Perception" Trans.IEICE. vol.J80-D-II. 2066-2073 (1997)

説明

関連する報告書

[文献書誌] Tatsurou TSUZUKI: "Still Image Effect in Speech Word Recognition" Human Interface. vol.13. 457-462 (1997)

説明

関連する報告書

[文献書誌] Nobuki FURUE: "Evaluation of MPEG-1 Video by Means of Inferior Speech Recognition" Human Interface. vol.14. 565-570 (1998)

説明

関連する報告書

[文献書誌] Tatsuro TSUZUKI: "A Comparison of Talking Image Effect of front and profile face image compressed by MPEG-1 format" Proc.Conference of Kansai Chapter, Japan Ergonomics Society. 93-98 (1998)

説明

関連する報告書

[文献書誌] 呉 俊: "音声識別における顔映像の役割" 電子情報通信学会論文誌. J80-D-II・8. 2066-2073 (1997)

関連する報告書

[文献書誌] 都築 達郎: "単語音声識別における静止映像の提示効果" Human Interface. 13. 457-462 (1997)

関連する報告書

[文献書誌] 古江 伸樹: "劣性音声識別実験法を用いたMPEG-1映像の品質評価" Human Interface. 14. 565-570 (1998)

関連する報告書

[文献書誌] 都築 達郎: "MPEG-1圧縮した正面映像と側面映像の話者映像効果の比較" 日本人間工学会関西支部大会講演論文集. 93-98 (1998)

関連する報告書

[文献書誌] 呉 俊: "音声識別における顔映像の役割" 電子情報通信学会論文誌. VOL.J80. 2066-2073 (1997)

関連する報告書

[文献書誌] 都築 達郎: "単語音声識別における静止映像の提示効果" ヒューマン・インタフェース・シンポジウム論文集. 第13回. 457-462 (1997)

関連する報告書

田村博京都工芸繊維大学, 大学院・工芸科学研究科, 教授 (70029411)

[文献書誌] 呉俊: "音声識別における顔映像の役割" 電子情報通信学会論文誌. J80-D-II・8. 2066-2073 (1997)

[文献書誌] 都築達郎: "単語音声識別における静止映像の提示効果" Human Interface. 13. 457-462 (1997)

[文献書誌] 古江伸樹: "劣性音声識別実験法を用いたMPEG-1映像の品質評価" Human Interface. 14. 565-570 (1998)

[文献書誌] 都築達郎: "MPEG-1圧縮した正面映像と側面映像の話者映像効果の比較" 日本人間工学会関西支部大会講演論文集. 93-98 (1998)

[文献書誌] 呉俊: "音声識別における顔映像の役割" 電子情報通信学会論文誌. J80-D-II・8. 2066-2073 (1997)

[文献書誌] 都築達郎: "単語音声識別における静止映像の提示効果" Human Interface. 13. 457-462 (1997)

[文献書誌] 古江伸樹: "劣性音声識別実験法を用いたMPEG-1映像の品質評価" Human Interface. 14. 565-570 (1998)

[文献書誌] 都築達郎: "MPEG-1圧縮した正面映像と側面映像の話者映像効果の比較" 日本人間工学会関西支部大会講演論文集. 93-98 (1998)

[文献書誌] 呉俊: "音声識別における顔映像の役割" 電子情報通信学会論文誌. VOL.J80. 2066-2073 (1997)

[文献書誌] 都築達郎: "単語音声識別における静止映像の提示効果" ヒューマン・インタフェース・シンポジウム論文集. 第13回. 457-462 (1997)