研究概要 |
本研究は,現在主流の波形接続方式の音声合成とは異なり,音声生成過程に基づく音声合成手法をシステムとして開発することを目的とする。この方式は,人間の発話メカニズムを模倣した声帯や声道のモデルに基づいて音声波形出力をシミュレートするため,その融通性に大きな特徴がある。この融通性を積極的に活用することで,発話代行等の信号変換器としての応用研究を目的とするものである。 本年度は,インタフェース統合に向けた個々の信号計測に関する研究と,統合の成果としてのコンバータの開発に向けて開発研究を行った。3次元の運動計測に関しては,対象物体の運動軌跡の形状を定量的に評価するための評価方法を検討し,フーリエ記述子を利用することで形状の定量評価を可能にした。視線入力インタフェースに関しては,設定の自動化を実現するためのアルゴリズムの検討を行い,実用性の改善を図った。これらの結果を踏まえ,音声合成関連インタフェースである声道形状マッピングインタフェースを基盤として,コンバータの開発を行った。マウスのワンクリックで,音響笛による声道形状の生成が可能なマッピングインタフェースの特徴を活用することで,計測データである,上肢運動の計測データや,視線による操作軌跡を基に,コンバータを駆動し,これらに基づいた母音合成が可能であることを確認した。その他,音声合成のための運動軌跡の生成モデルのシミュレーションなどから,合成方式の改善が可能となった。
|