Project/Area Number |
11780294
|
Research Category |
Grant-in-Aid for Encouragement of Young Scientists (A)
|
Allocation Type | Single-year Grants |
Research Field |
Intelligent informatics
|
Research Institution | Kagawa University |
Principal Investigator |
澤田 秀之 香川大学, 工学部, 助教授 (00308206)
|
Project Period (FY) |
1999 – 2000
|
Project Status |
Completed (Fiscal Year 2000)
|
Budget Amount *help |
¥2,200,000 (Direct Cost: ¥2,200,000)
Fiscal Year 2000: ¥600,000 (Direct Cost: ¥600,000)
Fiscal Year 1999: ¥1,600,000 (Direct Cost: ¥1,600,000)
|
Keywords | 音声 / 発声器官 / 機械モデル / 聴覚フィードバック / 学習 / ヒューマンインタフェース / 人工声帯 / 声道モデル |
Research Abstract |
人間の発声器官は主に、肺、声帯、声道、舌、口蓋とそれらを動かす筋肉などから成り、互いに適当な位置や形状を形成することにより音声が生成される。本研究は、人間と同等の発声器官を機械系によって構成し、聴覚フィードバックと自己学習によって人間の音声学習過程を再現し、また人間らしい発声手法を獲得させることを目的としてきた。 人間の発声機構は大きく分けて、声帯振動による音源の生成と、声道部共鳴によるホルマントの付加という二つの働きによって構成されている。主として顎や舌の非定常な動作によって引き起こされる変化から子音が生成され、母音は定常的な声道形状を形成することによって生成される。この発声機構を、エアコンプレッサ、圧力調節弁、流量調節弁、人工声帯、調音用共鳴管、マイクロホン、音声解析用計算機から成る機械系モデルによって構築した。7つのモータ(流量操作:1、声帯操作:1、共鳴管操作:5)によって機械系をダイナミックに制御することにより、聴覚フィードバックを用いた学習によって人間のように機械系が自ら音声を獲得できることを示した。 特に本年は、音声から発声動作を逆推定する処理にニューラルネットワーク(NN)を適用した。学習時において、NNはシステムが生成した音響の音響パラメータを入力とし、そのときの制御パラメータを教師信号とすることで、ある音響を生成するために必要な声道の形状を学習する。学習後、NNを声道モデルに対し直列につなぐ。NNに生成したい音響の音響パラメータを入力し、出力された制御パラメータから求められる声道の形状に変化させることによって、望む音響を生成することが可能となった。今後は、機械モデルによる音声獲得と人間の学習機構の解明を通して、新しいヒューマンインタフェース実現に向けての検討をおこなっていく。
|