2003 Fiscal Year Annual Research Report
機械式発話ロボットの開発と構音障碍患者の発声訓練支援システムの構築
Project/Area Number |
15700164
|
Research Institution | Kagawa University |
Principal Investigator |
澤田 秀之 香川大学, 工学部, 助教授 (00308206)
|
Keywords | 発話ロボット / 音声 / 声道物理モデル / 聴覚フィードバック / ニューラルネットワーク / 適応学習 / 発話障碍 / 支援技術 |
Research Abstract |
人間の発声器官は主に、肺、声帯、声道、舌、口蓋とそれらを動かす筋肉などから成り、互いに適当な位置や形状を形成することにより言葉が生成される。音声生成メカニズムや音声の認識手法などが古くから研究されており、特に最近のマン・マシンインタフェース技術には、人間らしい音声による情報の提示や、音声による入力デバイスが不可欠な要素となっている。本研究では、発話動作をおこなう器官をエアポンプ、人工声帯、声道共鳴管などを用いて機械的に構成し、計算機による聴覚フィードバック制御によって自らが音声を獲得、生成することができる発話ロボットの開発を進めてきた。人間の発声機構を物理的に構成することにより、より人間らしい手法で人間らしい音声を生成できると考えられる。 まず人間の発声器官に対応する各機能を、エアポンプ、空気圧・流量調節弁、人工声帯、調音用共鳴管、マイクロフォン、音響解析器によって構成した。人間の発話においては、顎や舌の非定常な動作によって引き起こされる変化から子音が生成され、一方の母音は定常的な声道形状を形成することによって生成される。頭部MR画像を基に人工声帯、声道、鼻腔の形状を決定し、人間の皮膚、粘膜組織に近い音響インピーダンスを持つシリコーンゴムを使って声道物理モデルを成形した。空気流量調整や声帯、共鳴管などの機械系各部の制御には、計9個のDCモータを用いた。 機械式声道モデルから生成される音声をマイクロフォンから入力し、音響解析部で解析を行う聴覚フィードバック機構により、人間が目標となる音声を与えることにより、機械系が自ら音声および発話動作を獲得できる学習機構の検討をおこなった。音響と声道形状の対応付けには自己組織化ニューラルネットワークを応用し、音声特徴とモータ制御量の関係を適応的に学習できる事を示した。
|
-
[Publications] Toshio Higashimoto, Hideyuki Sawada: "A Mechanical Voice System : Construction of Vocal Cords and its Pitch Control"Proceedings of International Conference on Intelligent Technologies. 762-768 (2003)
-
[Publications] Toshio Higashimoto, Hideyuki Sawada: "A Mechanical Voice System and its Adaptive Learning for the Mimicry of Human Vocalization"Proceedings of IEEE International Symposium on Computational Intelligence in Robotics and Automation. 1040-1045 (2003)
-
[Publications] 澤田秀之: "声道物理モデルの機械系による構築と聴覚フィードバックに基づく発話獲得に関する研究"サウンド技術振興財団 サウンド. 第19号. 7-10 (2004)
-
[Publications] Akihiro Hisada, Hideyuki Sawada: "Realtime Filtering for the Clarification of Esophageal Speech"Proceedings of Japan-China Workshop on Multidisciplinary Researches in Engineering. 53-60 (2003)
-
[Publications] Norio Takeuchi, Hideyuki Sawada: "Realtime Clarification Filter for the Speech with Cerebral Palsy"電気関係学会 四国支部大会 講演論文集. 353 (2003)
-
[Publications] 久田章弘, 澤田秀之: "スペクトル包絡と調波構造の強調処理による食道発声音声の実時間明瞭化"ヒューマンインタフェース学会誌. Vol.5, No.4. 447-454 (2003)