1994 Fiscal Year Annual Research Report
音声情報処理技術を応用した一般音声学演習支援システムの開発の研究
Project/Area Number |
05551006
|
Research Institution | Kansai University |
Principal Investigator |
壇辻 正剛 関西大学, 文学部, 助教授 (10188469)
|
Co-Investigator(Kenkyū-buntansha) |
梅崎 太造 中部大学, 工学部, 助教授 (40193932)
小林 豊 京都工芸繊維大学, 工芸学部, 助教授 (40027917)
|
Keywords | 一般音声学 / 国際音声記号(IPA) / 音声データベース / 実験音声学 / サウンド・スペクトログラム / 音声分析 |
Research Abstract |
平成6年度は以下の様な研究を推進した。音声データベースの充実を図り、音声入力と音声出力を合わせて、音声理解、音声合成などを統合管理するシステムの構築の研究を行なった。本研究では、ワークステーション上の標準的なウィンドウシステムであるX Window System上でグラフィカルユーザーインターフェース(GUI)を利用した音声分析表示システムの開発を行なった。この音声分析表示システムは一般音声学研究支援システムの発音訓練過程において根幹を成す部分でもある。したがって、利用者が自分の発音をチェックするために、分析・表示を効率よく進められることと共に、分析機能の充実と統一のとれた操作性、並びに高い拡張性と移植性の実現を心掛けた。システムの構成と動作は概説すると以下の様になる。音声波形の表示は符号付き16ビット音声の複数縦列表示、時間、振幅表示などである。各々の拡大表示及び縮小表示も可能である。音声データの切り出しはマウスにより領域を選択して行なう。その領域選択されたデータの試聴、分析が容易に行なえるように考慮した。音声の再生・録音は、8,000,11,025,16,000,22,050,32,000,44,100,48,000〔Hz〕の各周波数において符号付き16ビットの音声の再生・録音が可能である。スペクトル分析表示はFFT,LPC分析等から得られる母音や子音のスペクトログラムをフレーム単位、二次元的に表示できるように配慮した。フレーム長、フレーム周期、分析次数、窓関数等の変更を可能にした。利用者の発声した音声の周波数解析はマウス操作によって、時間軸上の任意の2点間に対して、128〜8192ポイントの範囲内で任意に指定することができる。これらの音響解析の手法を通じて、調音パラメータの重み付けの研究の進展が可能になるものと期待される。
|
-
[Publications] Dantsuji,M.,S.Doshita and S.Sagayama: "An Experimental Study of Distinctive Features Using Speech Recognition Technology" Studia Phonologica. 27. 9-21 (1994)
-
[Publications] Tronnier,M.and M.Dantsuji: "Some Acoustic Characteristics of Glottal and Palatal Fricatives in Japanese and German" Working Papers of Lund University,Sweden. 40. 213-228 (1994)
-
[Publications] 壇辻正剛: "日本語の音声表記について" 電子情報通信学会技術研究報告. SP-93-135. 53-60 (1994)
-
[Publications] 新美康永・小林豊: "音声認識の誤りを考慮した対話制御方式のモデル化" 情報処理学会技術研究報告・音声言語情報処理. 5-7. 47-54 (1995)