研究分担者 |
小林 哲則 法政大学, 工学部, 助教授 (30162001)
伊福部 達 北海道大学, 応用電気研究所, 教授 (70002102)
田村 進一 大阪大学, 医学部, 教授 (30029540)
中島 隆之 電子技術総合研究所, 知能情報部, 部長
柳田 益造 郵政省通信総合研究所, 知覚機構, 室長 (00116120)
|
研究概要 |
音声の特徴抽出手法の高度化のため,言語情報や個人性,自然性がいかなる形で音声波に含まれるかを検討した.成果は下記の通りである. 1)相互情報量を指標として,多種類の音響特徴量を多角的・階層的に用いて音韻性を決定する枠組みを確立した。話者性の特徴量を用いて多種類のコードブックを制御することによる話者適応の可能性を示した。 2)ピッチ対同期形のPSE分析法の適用による母音部のPSE分析結果と,一般的声道モデルに近似的な声道形と音源位置を与えて計算した伝達特性との類似性から,PSEと音声生成糸との関係を明らかにした. 3)口形情報を用い,音声認識の性能向上を図った.母音の識別を行う際,認識に有効な画像特徴の種類やレベルを明らかにした. 4)難聴者の聴神経刺激による時系列信号の知覚特性を調べ,人工喉頭の研究からピッチや波形ゆらぎの役割を明確にし,さらにホルマント遷移によって生じる結合音の知覚特性を明らかにした. 5)LPC分析精度の改善と特徴パラメータの時間的遷移を考慮に入れることによる音韻識別の改善を行った. 6)ニューラルネットワークで特徴抽出を行うための諸方式を検討した. 7)範躊間の依存関係扱える数量化理論を提案し,これを用いて範囲音韻の弁別素性の観点から音韻スペクトルの変形をモデル化した. 8)ニューラルネットによる音素認識に基づいて,状態遷移網により表現された単語辞書により,単語認識を行う方式を提案した. 9)連想を含む高次の知識を総動員して特徴抽出,認識を行うために洒落の一種である「地口」の検出法および連想の枠組みを明らかにした. 10)話者認識システムに必要となる個人性表現能力の高い特徴量を得るため,特徴量の統計的性質と認識性能との関係を明らかにした. 11)調音パラメタの高速抽出をニューラルネットを用いて行った.
|