研究課題/領域番号 |
26540087
|
研究機関 | 和歌山大学 |
研究代表者 |
河原 英紀 和歌山大学, システム工学部, 教授 (40294300)
|
研究分担者 |
森勢 将雅 山梨大学, 大学院医学工学総合研究部, 助教 (60510013)
|
研究期間 (年度) |
2014-04-01 – 2016-03-31
|
キーワード | 音声情報処理 / 非言語音声情報 |
研究実績の概要 |
自然な文字である手書き文字よりも、適切にデザインされた活字は遥かに読み易い。音声言語も、適切にデザインすることにより、自然な肉声そのままのものよりも、明瞭に聴き取ることができ、内容を良く理解し記憶でき、より深い感動を得、心の平安を得、警戒心を喚起できるなど、用途に応じたものとすることができる可能性がある。本研究課題では、申請者らが進めている、聴覚と同型の情報表現に基づく最新の音声分析・変換・合成技術(STRAIGHTを分析・合成の基盤とし、時変多属性かつ任意事例数での外挿を可能とするように拡張されたモーフィング技術)を利用することにより、用途に応じた機能を有する音声のデザインを可能とするシステムのプロトタイプ構築を目的として研究を進めた。 初年度は、探査的研究用基盤システムの構築を狙い、その第一段階として、科学技術計算環境であるMatlabの実時間入力機能と、イベント駆動型プログラムを利用した一群のツールを整備した。このツールは、既に確立されている技術を、対話的に直感的な操作で利用できるようにしたものであり、広く公開している。とくに、音声信号からリアルタイムで声道形状を推定し表示するシステムは、非常に高い関心を呼び、Edinbrough大学をはじめとした海外の教育研究機間においても活用されている。さらに、この声道形状推定の過程で求められるパラメタを応用することで、STRAIGHTによる分析結果を、声道形状を介して操作する方法を発見した。この表現は、これまでモーフィング応用の際の大きな障害となっていた参照点の設定を不要とする可能性があり、重要な突破口が開かれたと言える。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
達成目標として挙げた、(1) 前意識的影響を定量化する実験手法および音声加工ツール、(2) 好感度を 改善する音声のデザインテンプレートの作成、(3) 警戒心を喚起する音声のデザインテンプレートの作成。可能であれば、安心感や信頼感を促進する音声のデザインテンプレートの作成を狙うとした各項目の根幹となる、探査的研究用基盤システムの構築が大きく進展した。これには、二つの要因が関わっている。一つは、研究のツール開発のために用いている科学技術計算環境であるMatlabにおける実時間プログラムのための枠組みの確立である。これにより、探索的な検討のスループットを大きく向上させることができた。その結果、もう一つの要因である、声道形状を介したSTRAIGHTパラメタの操作が可能となり、デザインテンプレートの検討を効率化することが可能となったのである。さらに、この要因は、拡張された時変多属性任意事例数モーフィングを利用する上で障害となっていた、参照点の付与という操作を取り除くことにつながる。さらに、自励振動子と近似時変フィルタおよび局所的時間軸伸縮を用いることにより、実時間で品質劣化を招かずに音声に強い印象を与える属性を付与する方法を実現する枠組みを構築した。その上、短時間Fourier変換における巧妙な工夫により、STRAIGHTを凌ぐ品質での分析合成を可能とするCheap Trickという方法も発明されるに至った。この方法は、これまでSTRAIGHTに基づいて開発されて来た、モーフィング等、様々な応用技術においてSTRAIGHTを置き換えることも可能である。これらは、当初計画していた予想を超える成果であり、本課題を大きく進展させるものである。
|
今後の研究の推進方策 |
平成27年度は、前年度で得られた声道形状を介した操作体系を、その数理的背景にあるLSP(Line Spectrum Pair)を介することにより、時変多属性任意事例数モーフィングの自動化と、適切なユーザインタフェースの概念化の検討を進め、実際に利用可能なプロトタイプの提供までを目指す。また、この際、スペクトル推定部分に分担者の森勢によるCheap Trickの組み込みを進める。その際に、システムのパラメタを適切に設定するため、本格的な主観評価実験を行い、結果を資料化する。また、こうして構築したプロトタイプを利用することにより、様々な機能を有する音声のデザインテンプレートを作成する。
|
次年度使用額が生じた理由 |
初年度の終盤において、本課題の成果の応用可能性を大きく広げる可能性のある情報表現と操作体系に関する発見があった。また、新たなスペクトル推定法の発明という、予想を大きく超える成果が得られた。これらを踏まえ、この新しい表現と操作体系に基づく基盤アルゴリズムとソフトの開発を重点化することとした。そのため、当初計画していた主観評価実験を、初年度は予備実験の規模にとどめ、次年度に、この新しく構築した基盤アルゴリズムとそれに基づくソフトを対象として、本格的な主観評価実験を行うこととした。そのために、初年度の規模を縮小した分を、次年度使用額とすることにより、次年度の実験の規模の拡大を可能とした。
|
次年度使用額の使用計画 |
初年度に発見された情報表現と操作体系に基づいて基盤アルゴリズムとそれに基づく応用システムのソフトを開発し、評価する。そのために、開発の各段階で必要となる主観評価実験を本格化し、それらに基づいて、目標とするデザインテンプレートを拡充する。これらに、前述の次年度使用額を活用することで、より充実した成果とすることを狙う。
|