研究分担者 |
阿曽 弘具 東北大学, 工学部, 助教授 (10005522)
高橋 修 富士通(株), 通信企画部複合システム企画部, 部長
江島 俊朗 (江島 俊明) 長岡技術科学大学, 助教授 (00124553)
牧野 正三 東北大学, 応用情報学研究センター, 助教授 (00089806)
城戸 健一 東北大学, 応用情報学研究センター, 教授 (30006209)
安倍 正人 東北大学, 工学部, 助手 (00159443)
|
研究概要 |
2年間に亘る研究成果の概要は次の通りである. 1.音素認識 音素認識は, 単語や文節音の大分類の結果として選択された候補の正当性を検討するための構造解析に重要な役割を果す. そこで, 音素認識の精度を上げる研究に重点を置いた. その結果, 特に母音, 鼻音, 破裂性子音の認識率を向上させることができた. 母音については, 母音間相対関係を利用した母音認識手法を開発し, 従来より高い認識率を達成した. 2.単語音声認識 単語音声を認識する強力な手法を開発した. 本手法は2つの部分からなる. 第1の部分は, 我々が文字認識で開発した連想整合法と呼んでいるパターン整合法を音声認識に適用したもので, 単語音声を高精度で大分類することを可能にしたものである. 第2の部分は, 音素認識を基にした単語音声の構造解析を行うもので, 大分類の結果として得られた候補単語の検証に効果的である. 3.話者適応 同一話者が発生した日本語5母音の特徴空間における相対的な位置の間には, 話者によらないと見なし得る2項関係が存在することを見出し, この関係を基にして上述の1.で述べた母音認識手法を開発した. 話者の個人性はより多く母音にに反映されるので, この母音認識手法を用いることにより, 話に依存しない母音認識, つまり話者適応が可能となった. 4.認識実験 上述の単語音声認識手法を男性10名が発声した212単語に適用し, 従来にない高精度の認識を達成した. 即ち, 1位認識率は98.2%であり, 2位までの累積認識率は99.6%である. この結果は単語音声の大分類として30位までの累積認識率99.86%が得られたのに対し, 母音認識とDP法を併用した構造解析によって達成されたものであって, 計算量の多いDP法の代りに子音を含めた音素認識のみによって構造解析を行うことが今後の課題である.
|