2022 Fiscal Year Annual Research Report
調音運動データベースの構築とデータベース間の正規化および調音運動ベースの音声合成
Project/Area Number |
19K12024
|
Research Institution | Tokyo University of Science |
Principal Investigator |
桂田 浩一 東京理科大学, 理工学部情報科学科, 教授 (80324490)
|
Co-Investigator(Kenkyū-buntansha) |
牧野 武彦 中央大学, 経済学部, 教授 (00269482)
若宮 幸平 九州大学, 芸術工学研究院, 助教 (70294999)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | 調音運動 / 音声合成 / IPA / EMA |
Outline of Annual Research Achievements |
2022年度は2021年度に引き続き日本語調音運動データベースの構築を行った.また,調音運動ベースの音声合成のための要素技術の検討を行った. 日本語調音運動データベースについてはEMA(Electromagnetic Articulography)の機器故障のため被験者によるデータ収録が実施できなかったが,IPA(International Phonetic Alphabet)のラベリングについては1名分のラベリングを完了した.IPAとは言語に依存せず決められている発音に関する世界共通の記号である.本研究課題では収録した音声に対してIPAラベリングを行い,このIPAラベルを利用することによりテキストからIPAを経由して音声を生成することを目標としている. 調音運動ベースの音声合成の要素技術としては,テキストから調音運動を生成するための深層学習モデルを検討し,従来手法と比較して高精度な推定が可能であることを予備的に示した. 研究機関全体を通じて,EMAを用いた日本語調音運動を7名分収録し,1名についてはIPAラベリングを終えた.今後,データを整理し,データベース化した上で公開を目指したい.また,調音運動からの音声合成については多人数話者を対象とした合成方法を開発した他,音素系列から調音運動を推定する方法について,音素系列からIPAを推定する方法,IPAから調音運動を推定する方法,また音素系列から直接調音運動を推定する方法について検討し,それぞれの成果を学会等で報告した.多数の調音運動データベース間の正規化については今後の課題として残っている.
|