本研究では、聴覚に障害を持つ人のための発声発話練習機「スピーチトレーナ」の開発研究に関する研究を行った。スピーチトレーナは、当研究室において約30年あまりの期間にわたり研究を行っており、そこで開発された専用のハードウェアおよびソフトウェアからなるシステムは、随時、聾学校や言葉の教室などに提供されてきている。 一方、近年の32ビットコンピュータの進化に着目したとき、従来のスピーチトレーナに搭載してきた音声分析の各手法は、特化したハードウェアを加えることなく、コンピュータ本体で実時間処理できる可能性がでてきている。また、コンピュータの基本的な機能であるネットワーク機能や音声・画像を取り扱うマルチメディア機能を考慮すると、スピーチトレーナは、より高い教育効果が期待できるシステムとして改良が可能となると考える。 本研究では、まず、シングルタスク型のオペレーティングシステムとDSPとから構成されていた従来のスピーチトレーナの全プログラムを、近年普及の著しいマルチタスク型オペレーティングシステムに移植している。つぎに、システムに採用している音声分析の手法を見直し、パーソナルコンピュータでの処理に適した音声分析アルゴリズムについて検討して、声帯の振動数検出やスペクトル分析、および声道断面積関数の推定アルゴリズムなどを改造するとともに、これらが同時使用できるマルチタスク型プログラムを開発している。 さらに、電話回線やコンピュータネットワーク利用を想定し、分析結果の表示形式、管理形式およびネットワークを通じたデータ伝送について検討した。本スピーチトレーナの使用者は必ずしもコンピュータの専門家ではないので、より平易な使用形態が望まれる。そこで、一般に広く普及しているインターネット閲覧プログラムを分析結果表示に利用する方向でプログラム改造を行った。またこの場合、インターネットを通じて練習者の個人情報を転送せざるを得ない状況が生まれるので、カオスを用いた秘密通信符号化について検討を加えている。その結果、本スピーチトレーナシステムは、聾学校や言葉の教室のみ成らず、すでに社会人となっている人への遠隔指導の可能性を実現できたものと考えている。
|