研究概要 |
平成6年度は以下の様な研究を推進した。音声データベースの充実を図り、音声入力と音声出力を合わせて、音声理解、音声合成などを統合管理するシステムの構築の研究を行なった。本研究では、ワークステーション上の標準的なウィンドウシステムであるX Window System上でグラフィカルユーザーインターフェース(GUI)を利用した音声分析表示システムの開発を行なった。この音声分析表示システムは一般音声学研究支援システムの発音訓練過程において根幹を成す部分でもある。したがって、利用者が自分の発音をチェックするために、分析・表示を効率よく進められることと共に、分析機能の充実と統一のとれた操作性、並びに高い拡張性と移植性の実現を心掛けた。システムの構成と動作は概説すると以下の様になる。音声波形の表示は符号付き16ビット音声の複数縦列表示、時間、振幅表示などである。各々の拡大表示及び縮小表示も可能である。音声データの切り出しはマウスにより領域を選択して行なう。その領域選択されたデータの試聴、分析が容易に行なえるように考慮した。音声の再生・録音は、8,000,11,025,16,000,22,050,32,000,44,100,48,000〔Hz〕の各周波数において符号付き16ビットの音声の再生・録音が可能である。スペクトル分析表示はFFT,LPC分析等から得られる母音や子音のスペクトログラムをフレーム単位、二次元的に表示できるように配慮した。フレーム長、フレーム周期、分析次数、窓関数等の変更を可能にした。利用者の発声した音声の周波数解析はマウス操作によって、時間軸上の任意の2点間に対して、128〜8192ポイントの範囲内で任意に指定することができる。これらの音響解析の手法を通じて、調音パラメータの重み付けの研究の進展が可能になるものと期待される。
|