2015 Fiscal Year Annual Research Report
笑いを誘発する音声メディアの特徴分析に基づいた笑い誘発音声フィルタの試作
Project/Area Number |
26540138
|
Research Institution | Tohoku University |
Principal Investigator |
坂本 修一 東北大学, 電気通信研究所, 准教授 (60332524)
|
Co-Investigator(Kenkyū-buntansha) |
佐藤 洋 国立研究開発法人産業技術総合研究所, ヒューマンライフテクノロジー研究部門, グループ長 (10260423)
大谷 智子 東京藝術大学, 芸術情報センター, 助教 (40422406)
|
Project Period (FY) |
2014-04-01 – 2016-03-31
|
Keywords | 感性情報学 / 認知科学 / ユーザインタフェース / 情報システム |
Outline of Annual Research Achievements |
本研究は,笑いを引き起こす音声メディアの特徴を工学的に明らかにし,その特徴を積極的に利用することで,笑いを引き起こす音声の合成技術の構築可能性を明らかにするものである。笑いを引き起こす音声メディアの特徴を反映するフィルタを構築し,通常の音声に適用することで,聴取者に笑いを誘発する音声を合成することを目指す。 平成27年度は,ディジタル信号処理を駆使して加工した音声を用いた聴取実験により,音声が笑いを引き起こすために必要な物理特徴量を分析した。この際に,音声の話速とピッチに着目し,日常の経験から「笑いを誘発する音声は,通常は聞いている音声の持つ物理的な特徴と大きく異なる」ことを仮説として,話速とピッチをともに元々の音声から大きく変化(話速:0.25~2.5倍,ピッチ:0.25~8倍)させて実験刺激を作成した。実験では,話速とピッチをパラメトリックに変化させた30個の刺激群の全ての組み合わせで順番を考慮して一対比較を行い,聞いたときの面白さを5段階で評価させて,刺激群を一次元に付置して面白さを分析した。実験の結果,通常よりもピッチが高く(男性:8倍,女性:4倍),かつ,話速が遅い(男性,女性ともに0.25倍)音声を聞いたときに,聴取者がもっとも面白いと感じることが明らかとなった。この結果は当初の仮説を裏付ける結果である。さらに,検出した顔周囲の動きから口角,口,歯の見え方により聴取者が笑ったかどうかを検出するKinectを用いたシステムを用いて,使用した実験刺激を聞いたときの聴取者の顔の動きを客観的に分析を行った。30個の音声刺激を聞かせた所,評価実験の結果と同じく,ピッチが高く話速が遅い音声を聞いたときに聴取者の表情が笑っていたことが明らかとなった。 以上の結果から,本研究の目的である笑いを引き起こす音声は,入力された音声のピッチ,話速を変えることで創出可能となることが示された。
|
Research Products
(1 results)