Project/Area Number |
19K12086
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 61020:Human interface and interaction-related
|
Research Institution | Tohoku Institute of Technology |
Principal Investigator |
Ito Masashi 東北工業大学, 工学部, 教授 (00436164)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Project Status |
Completed (Fiscal Year 2021)
|
Budget Amount *help |
¥3,510,000 (Direct Cost: ¥2,700,000、Indirect Cost: ¥810,000)
Fiscal Year 2021: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2020: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2019: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
|
Keywords | 音声合成 / 生体計測 / 運動 / わたり音 / モーションセンサー / ヒューマンインターフェース / 身体運動 / Motion-to-speech / 身体動作 |
Outline of Research at the Start |
テキスト入力が完了してから発声する従来のText-To-Speech型の音声合成に代わる枠組みとして、身体動作で音の高さや大きさ、音韻などのパラメータを即時的に操作するMotion-To-Speech型の音声合成システムを開発する。直感的で分かりやすい操作で、使用者の意思や情動を反映した表現力豊かな音声を出力するシステムを実現するため、人間の身体動作の精度や速度を調べる人間工学的な計測実験と、発声の運動指令における処理単位を明らかにする認知科学的な実験を行う。この様な音声合成システムは、例えば失声者の代替発声手段などに応用できると期待される。
|
Outline of Final Research Achievements |
Two types of input motions were examined for synthesizing glide /w/ and /y/ with a motion-to-speech synthesizer. Using the synthesizer, subjects were required to reproduce the identical speech signals to the target one which presented beforehand. The reproduced speech parameters showed significant overshoots from the targets. The amounts of the overshoots were smaller when the synthesizer was controlled by hand motions than the case where it was controlled by arm motions. The difference became prominent in the fast transition of the speech parameters. The results indicated the mass of the body to be important factor for precious control in the synthesis.
|
Academic Significance and Societal Importance of the Research Achievements |
Motion-To-Speech型音声合成は、失声者の代替発声装置としての応用が期待されており、誰でも簡単に使えるシステムを実現することが課題となっている。本研究では、この様なシステムの入力として用いる身体動作の動特性を定量化した点に意義があり、これまで個々の研究者が試行錯誤的に行ってきた入力動作の選定に関して、身体工学的な視点からより理に適った設計指針を提供するものであると位置づけられる。本研究で明らかになった身体部位の質量に関する知見を活用することで、より操作性の高いMotion-to-speechシステムが実現できる可能性がある。
|