2008 Fiscal Year Annual Research Report
音声から発話動作を推定する発話ロボットの構築と対話型発声訓練システムの提案
Project/Area Number |
18500152
|
Research Institution | Kagawa University |
Principal Investigator |
澤田 秀之 Kagawa University, 工学部, 准教授 (00308206)
|
Keywords | 発話ロボット / 音声 / 聴覚フィードバック / 自己組織化ニューラルネット / 適応学習 / 聴覚障がい者 / 発話訓練 / 支援技術 |
Research Abstract |
これまでに構築した発話ロボットにより、音声の特徴から、その音声を生成するのに必要な口内の発話動作が再現できることを示してきた。最終年度は、聴覚障碍者や発話障碍者が、見本となる構音動作や口内の動きを見ながら、対話的に発話訓練をおこなうシステムを総合的に評価しながら、これまでの問題点の改良をおこなった。 まず音素と発話動作の対応付けに、自己組織化マップ(SOM)を用いたニューラルネットワーク学習を用いていたが、2次元SOMにおいては音素間の遷移を充分に再現出来ない場合が見られた。そこで音素マップを3次元空間に拡張した3次元SOMを提案し、発話ロボットの音響学習に応用した。その結果、音素の分離度が向上し、音声から発話動作への推定も良好に行えることが確認できた。また、ロボットの声道形状と訓練者の口内形状との対応が解りにくいという指摘には、これを図によって説明して訓練者が充分に理解できた上で、実験をおこなうこととした。 香川県立聾学校の協力を得て、高等部8名、中等部10名の聴覚障碍を持つ生徒に、発話訓練実験をおこなった。ロボットはまず、訓練者が発声した音声から、その音声を発声するための声道形状を推定し、目標形状と対比しながら提示する。訓練者は、ロボットの声道形状と自身の口内形状の違う部分を自ら意識しながら、再度発声する。以上を繰り返しながち、目標の声道形状と、訓練者の口内形状が近くなるまで対話的に訓練をおこなった。その結果、15名が良好に発話動作を獲得でき、本ロボットシステムが発話訓練装置に利用できることが実証できた。今後、更に発話訓練実験を続けながらシステム構築を進め、対話型発話訓練装置の実用化につなげていく。
|