2000 Fiscal Year Annual Research Report
発声器官の機械系による構成と音声獲得メカニズムの解明
Project/Area Number |
11780294
|
Research Institution | Kagawa University |
Principal Investigator |
澤田 秀之 香川大学, 工学部, 助教授 (00308206)
|
Keywords | 音声 / 発声器官 / 機械モデル / 聴覚フィードバック / 学習 / ヒューマンインタフェース / 人工声帯 / 声道モデル |
Research Abstract |
人間の発声器官は主に、肺、声帯、声道、舌、口蓋とそれらを動かす筋肉などから成り、互いに適当な位置や形状を形成することにより音声が生成される。本研究は、人間と同等の発声器官を機械系によって構成し、聴覚フィードバックと自己学習によって人間の音声学習過程を再現し、また人間らしい発声手法を獲得させることを目的としてきた。 人間の発声機構は大きく分けて、声帯振動による音源の生成と、声道部共鳴によるホルマントの付加という二つの働きによって構成されている。主として顎や舌の非定常な動作によって引き起こされる変化から子音が生成され、母音は定常的な声道形状を形成することによって生成される。この発声機構を、エアコンプレッサ、圧力調節弁、流量調節弁、人工声帯、調音用共鳴管、マイクロホン、音声解析用計算機から成る機械系モデルによって構築した。7つのモータ(流量操作:1、声帯操作:1、共鳴管操作:5)によって機械系をダイナミックに制御することにより、聴覚フィードバックを用いた学習によって人間のように機械系が自ら音声を獲得できることを示した。 特に本年は、音声から発声動作を逆推定する処理にニューラルネットワーク(NN)を適用した。学習時において、NNはシステムが生成した音響の音響パラメータを入力とし、そのときの制御パラメータを教師信号とすることで、ある音響を生成するために必要な声道の形状を学習する。学習後、NNを声道モデルに対し直列につなぐ。NNに生成したい音響の音響パラメータを入力し、出力された制御パラメータから求められる声道の形状に変化させることによって、望む音響を生成することが可能となった。今後は、機械モデルによる音声獲得と人間の学習機構の解明を通して、新しいヒューマンインタフェース実現に向けての検討をおこなっていく。
|
-
[Publications] Hideyuki Sawada and Shuji Hashimoto: "Mechanical Model of Human Vocal System and Its Control with Auditory Feedback"JSME International Journal, Series C. Vol.43,No.3. 645-652 (2000)
-
[Publications] Hideyuki Sawada and Shuji Hashimoto: "Mechanical Construction of a Human Vocal System for Singing Voice Production"Advanced Robotics, International Journal of Robotics Society of Japan. Vol.13,No.7. 647-661 (2000)
-
[Publications] 佐治裕一郎,Pitoyo Hartono,橋本周司,澤田秀之: "声道物理モデルによる音響生成"情報処理学会研究報告. MUS-36. 13-18 (2000)
-
[Publications] 佐治裕一郎,Pitoyo Hartono,橋本周司,澤田秀之: "声道物理モデルのニューラルネットワークによる制御"情報処理学会 第62回全国大会 講演論文集. (2001)
-
[Publications] 東本敏男,澤田秀之: "声道物理モデルの聴覚フィードバックによる音響生成(発表予定)"ロボティクスメカトロニクス講演会2001. (2001)