研究概要 |
本研究では, 従来より行ってきた, ルール表現された知識を用いた連続音声認識研究の経験を生かして, 音声認識のための本格的な知識ベースの構築とそのための支援環境の開発を行った. 当初の計画では, 支援環境は認識システムを核として, ルールデータベース, 音声データベース, 及び認識システムインタフェイスの3つの支援モジュール群より構成される予定であったが, 最終的な構成ではルールトランスレータが加わり, 合計5つのモジュール構成となった. ルールデータベースはルール(認識知識)のドキュメントの管理, ルール実行履歴と音声データとの関連の保持などを行い, 音声データベースはルール作成, 或はシステム評価用のデータの提供を行う. ルールトランスレータは音声の専門家用に設計された高級言語から認識システムが用いているプロダクションシステムOPS5のソースコードへの変換を行い, インタフェイスは各モジュールを利用して知識ベースを構築するためのコマンド群を提供する. この構築支援環境はLispマシンで開発され, インタフェイスの優れたシステムとなっている. 認識システムの実行結果はマルチウインド上に表示され, 殆どの情報はマウスセンシティブになっているため, システムの処理を利用者が容易に知ることができるようになっている. この環境を利用して, 認識知識ベースを整備したところ, 認識性能を落とすことなく, ルールの数を約70%に縮小することができた. 支援環境によるルールの開発効率に関して, それがないときに比べて10-20倍の向上が確認された. そして, 最終的に構築されたルールベースの認識性能として, 6人の成人男性の連続音声にたいして, 94%の音韻境界認識率, 87%の音韻認識率を得た. 本研究によって, 知識工学的な方法に基づく音声認識の新しい方法論の確立への知見が得られた.
|