研究課題/領域番号 |
61580018
|
研究機関 | 東京大学 |
研究代表者 |
広瀬 啓吉 東大, 工学部, 助教授 (50111472)
|
研究分担者 |
引地 拓夫 東京大学, 工学部, 助手 (20010928)
森川 博由 東京大学, 工学部, 助手 (40011217)
藤崎 博也 東京大学, 工学部, 教授 (80010776)
|
キーワード | 光学的信号処理 / 2次元信号 / 音声信号の処理 / スペクトル分析 / パタン照合 / 音声認識 / 時間軸非線形伸縮 / 液晶フィルタ |
研究概要 |
光学的信号処理手法は、2次元信号を並列に処理し得るため、これを音声信号の処理に利用した場合、音声の周波数スペクトルの時間変化パタンを分析窓を時間軸にそって移動することなしに得られる、パタン照合を光の伝播速度で行える、という利点がある。本研究はこのような見地から、光学的な音声信号処理手法を確立することを目的とし、以下の実績をあげた。 1.音声のスペクトル分析およびパタン照合を行う光学的信号処理システムについてスペクトル分析部の改良、パタン照合部の作成を行った。スペクトル分析部については、母音音声,CV音声を対象としたスペクトル分析実験を行い、得られた結果を計算機による分析結果と比較して、その動作を確認した。パタン照合部については、連続母音音声を対象としたパタン照合実験を行い、パタンの一致度の時間変化が得られることを示した。 2.未知入力音声パタンとの照合を各標準音声パタンについて行い、照合結果を比較することによって音声認識が行える。標準パタンのパタン毎の平均透過率の差異を正規化する評価関数を定義し、男性話者1名が発声した5母音音声を対象とした認識実験を行い、評価関数の有効性を立証した。 3.窓プレートの透過パタンの形状を変えることにより、スペクトル分析部で得られる音声のパワースペクトラムの時間変化パタンの時間軸非線形伸縮が行えることを実験的に確認した上で、窓プレートを写真フィルムから液晶フィルタに置き変え、パーソナル計算機で透過パタンを制御して実時間の時間軸非線形伸縮を達成した。 以上、交付申請書に記載された本研究の計画は、ほぼ予定通り達成された。なお、昭和62年度には、パタン照合に際して最適の非線形伸縮を自動的に得る方法、複数の標準パタンとの照合を同時に行う方法、の開発を進め、当初の目的を達成する予定である。
|