1995 Fiscal Year Annual Research Report
連続音声理解の時間的経過に関する知覚的検討とその音声理解システムへの応用
Project/Area Number |
07780347
|
Research Institution | Tokyo University of Science |
Principal Investigator |
大野 澄雄 東京理科大学, 基礎工学部, 助手 (80256677)
|
Keywords | 連続音声理解 / 音声知覚 / 韻律的特徴 / 局所発話速度比 / 基本周波数パターン / 音声分析再合成 |
Research Abstract |
1.連続音声資料の収集および整理 ATR連続音声データベース(6話者各35,000円)を購入し、アルバイトの助力を得てこれを整理し分析のための準備を行った(謝金35,500円)。 2.韻律を制御した音声の分析再合成方式の確立と実装 音声資料をコンピュータ上で処理するため,DATインターフェイス装置(566,500円)およびDATデッキ(167,890円)を購入し,聴取実験を行う場合の音声刺激作成用のツールを作成した。この際,データベースに含まれる音声の韻律を制御するため,まず,発話速度の局所的な振る舞いを制御する方式について検討した。これには,研究代表者らが別途提案した局所発話速度比による発話速度の分析手法を利用し,聴取実験の音声刺激としての実用に耐え得るパラメータの設定のための知覚実験を実施することにより定めた。また,音声の韻律的特徴のうち基本周波数パターンの制御のために,基本周波数パターン生成過程のモデルに基づいて,基本周波数パターンの生成を行うこととした。その結果,音声の韻律的特徴のうち,発話速度と基本周波数パターンとを独立に,かつ柔軟に制御し得る音声の分析再合成を行うツールをコンピュータ上に実装した。 3.一様な雑音下での連続音声聴取実験 上記2.の音声分析再合成ツールを用いて,音声の韻律的特徴を変化させ,かつ雑音を一様に付加した音声を作成し,音声聴取実験を計画するとともに,若干の実験を行った。本研究の期間内では十分な結論を導くのに必要なデータを得るには至らなかったが,本補助金を得て作成した音声分析再合成ツールを利用し,今後も引き続いて検討を進める予定である。
|
-
[Publications] Sumio Ohno: "A method for quantitative analysis of the local speech rate" Proc.4th European Conference on Speech comm.and Tech.1. 421-424 (1995)
-
[Publications] 大野澄雄: "局所発話速度比を用いた音声の時間構造記述に関する知覚的検討" 日本音響学会平成8年度春季研究発表会講演論文集. 1. 219-220 (1996)