研究課題/領域番号 |
24650085
|
研究機関 | 和歌山大学 |
研究代表者 |
河原 英紀 和歌山大学, システム工学部, 教授 (40294300)
|
研究分担者 |
森勢 将雅 山梨大学, 大学院医学工学総合研究部, 助教 (60510013)
|
研究期間 (年度) |
2012-04-01 – 2014-03-31
|
キーワード | 音声分析 / 音声変換 / 主観評価実験 / 脳活動 / 潜在知覚 / モーフィング / 一般化線形モデル |
研究概要 |
自然な文字である手書き文字よりも、適切にデザインされた活字は遥かに読み易い。音声言語も、 適切にデザインすることにより、自然な肉声そのままのものよりも、明瞭に聴き取ることができ、内 容を良く理解し記憶でき、より深い感動を得、心の平安を得、警戒心を喚起できるなど、用途に応じ たものとすることができる可能性がある。本研究課題は、最新の音声変換技術、合成技術を利用する ことにより、そのような用途に応じた機能を有する音声をデザインするための方法論を明らかにする ことを目的とする。研究の基盤としては、申請者が開発しており、現在、音声知覚および音声合成研 究のデファクトスタンダードとなっている STRAIGHT を必要に応じて拡張して用いる。この計画に基づき、初年度は研究環境としてのツール群の整備と手法の構築、素材のスクリーニング、対話的操作環境の構築を開始した。この過程で、大量の音声の分析に必要となる、高精度かつ高速の基本周波数分析法を発明した。また、これまで安定な分析が困難であった群遅延の安定化に成功した。さらに、中核的研究手段であるSTRAIGHTの処理内容を見直し、合成部分の実装を時変フィルタとして明確化するとともに、汎用性の高い関数ポインタを用いた構造とした。これらを用いて様々な操作を行い、知覚との関連を研究を進めた。その過程で、聴覚心理実験を、これまでの統計的手法を見通し良く包含することのできる一般化線形モデルに適した実験用ユーザインタフェースを開発することにより、効率よく遂行し分析できる環境を整備した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
画期的なアルゴリズムの発明により、当初想定していた範囲を含み、大きく内容を拡充できる見通しが生まれた。また、聴覚心理実験用のGUIと実験手法を並行して開発することにより、当初の想定以上に研究手段とその応用の内容を深めることができた。これは、次年度に向けての準備として期待した以上のものであり、大きな発展につながるものである。
|
今後の研究の推進方策 |
初年度に高度なレベルに達した準備状況を活用して、新しく構築した対話的操作環境を用い、実際に強い印象を与える音声間のモーフィングを利用するこ とにより、用途に応じた機能を有する音声のデザイン事例を蓄積する。このデザイン事例のログから 共通するパターンを抽出し、デザイン方法論の作業仮説を形成し、目標とする以下の二種類の音声へ の変換と聴取実験を行なう。それらは、(1) 警戒心を喚起する音声、および (2) 安心感を促進する音 声である。この評価に際し、初年度の (1) において構築した試験システムと、実験と並行して行なう NIRS および脳波計を用いた非侵襲的脳活動観測により、目的の一つである、(3) 前意識的影響を定量 化する実験手法および音声加工ツールの検証を行なう。
|
次年度の研究費の使用計画 |
研究分担者が年度内(2月)に旧所属の立命館大学より現所属の山梨大学に異動したため、昨年度末に予定していた音声収録用の機材の購入と素材の追加収録とスクリーニングなどの研究計画を、次年度に遂行することとした。この変更は、計画を遅延させるものではなく、達成度で説明した画期的案アルゴリズムの周辺を、和歌山大学で固めるための時間の余裕を生むことにつながり、むしろ計画をバランス良く推進する上で有益である。
|