2004 Fiscal Year Annual Research Report
発声力学に基づくタスクプランニング機構の構築における機械モデルの開発
Project/Area Number |
03J01136
|
Research Institution | Waseda University |
Principal Investigator |
西川 員史 早稲田大学, 理工学部, 特別研究員(PD)
|
Keywords | 発話器官 / 機械モデル / 音声合成 / 自律制御 / 聴覚フィードバック |
Research Abstract |
従来のWT-4までの問題点を改良した新型発話ロボットWT-5(Waseda Talker-No.5を開発した。WT-5は肺・声帯・口腔および鼻腔からなる全18自由度の制御機構を有し、声道長さは約175mmと人間と同程度の大きさを持つ。口唇・声帯部などは弾性体として熱可塑性ポリマーであるセプトンを採用した。この素材はこれまでの素材よりも大きな弾性を持ち、型を用いて自由な形状の成形を行うことが可能となった。この素材を用いて人間の生理学的機構を模擬した声帯を開発し、人間の声帯に近い振動を実現した。口唇に関しても人間の形状に近いものを開発した。上記改良によってより人間に近い音声生成を実現した。 そして、子音発話の聞き真似を実現するために、感覚センサ(触覚および口腔内圧)を設置し、人間の発話時の感覚情報を計測し、ロボットの感覚センサの値が人間の発話時の値に近づくようにフィードバックを行い、子音発話の最適化を行った。 また、2003年度に開発した聴覚フィードバックアルゴリズムは最適化に時間を要しており、あらかじめ母音ごとの音響特徴量の最適化を行っておき、人間が発話した音声の音声認識を行い、それによって得られた音素および時間長のパラメータを用いて聞き真似発話を行った。この結果、従来のアルゴリズムでは1日程度を要していた最適化が数秒で行えるようになった。 以上、弾性体の成形技術を確立し、それを用いることにより人間の生理学的機構を模擬した声帯および口唇を有する人間形発話ロボットWT-5を開発した。WT-5は人間に近い声帯振動を実現し、従来のロボットに比べ、より人間に近い音声生成を実現した。また、口腔内圧および触覚センサを用いて子音のロボット制御パラメータを最適化する方法、および音声認識を用いて聞き真似発話探索を効率化する手法を開発した。
|
Research Products
(6 results)