2016 Fiscal Year Annual Research Report
Construction of story teller system by human voice production simulator
Project/Area Number |
25240026
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
赤木 正人 北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (20242571)
|
Co-Investigator(Kenkyū-buntansha) |
党 建武 北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (80334796)
鵜木 祐史 北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (00343187)
田中 宏和 北陸先端科学技術大学院大学, 先端科学技術研究科, 准教授 (00332320)
宮内 良太 北陸先端科学技術大学院大学, 先端科学技術研究科, 助教 (30455852)
森川 大輔 北陸先端科学技術大学院大学, 先端科学技術研究科, 助教 (70709146)
末光 厚夫 札幌保健医療大学, 看護学部, 准教授 (20422199)
川本 真一 群馬工業高等専門学校, 電子情報工学科, 講師 (70418507)
北村 達也 甲南大学, 知能情報学部, 教授 (60293594)
齋藤 毅 金沢大学, 電子情報学系, 助教 (70446962)
榊原 健一 北海道医療大学, リハビリテーション科学部, 准教授 (80396168)
|
Project Period (FY) |
2013-04-01 – 2017-03-31
|
Keywords | 音声情報処理 / 音声合成 / 音声知覚 / 音声生成 |
Outline of Annual Research Achievements |
本研究では,表現豊かな音声合成システムの忠実な実現を目指して,本を読み聞かせるシステム:Digital Story Teller Systemの構築を行った。本年度は最終年度であるため,過去3年間に実施した内容も考慮の上,以下に示す研究を実施した。 1.生成モデル: 昨年度提案した三層構造の音声変形システムをデモシステムとして用い,表現豊から物語朗読音声の合成を試みた。合成音は,感情カテゴリの情報を確実に伝えるものであったが,一部の発話スタイルにおいて,意図した程度の感情よりも弱い印象を与える合成音声となるものがあった。これは,スペクトルのダイナミックス記述にまだ問題が残っていることを示唆している。この記述法の改善は今後の課題である。また,より生理学的な音声生成機構を模擬したARX-LFモデルによる表現豊かな音声の分析・合成も試みた。感情ごとに声帯振動,声道形状がどのように関わっているかを明らかにできた。 2.知覚モデルについては,知覚モデルを表現豊かな音声の客観的評価システムとして用い,生成モデルと合成音の客観的評価により自動で目標の知覚印象に近づくようにモデルパラメータを制御できるシステムの構築を試みた。合成音声の評価値推定は行えることはわかったが,推定時に必要な音声セグメンテーションの自動化に問題があり,このモデルを用いた手動での客観評価は行えるものの,全自動客観評価システム構築までには至らなかった。 3.統合システム: ストーリーテラーシステムへの入力,この値にもとづいた合成音声の作成,合成音声の評価値,すべてをV-A空間上での位置情報をもとに表現することで,Story Teller Systemの構築を試みた。そして,デモシステムを構築した。
|
Research Progress Status |
28年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
28年度が最終年度であるため、記入しない。
|
Research Products
(79 results)
-
-
-
-
-
-
-
-
-
-
-
-
-
[Journal Article] High-speed Videolaryngoscopy: Quantitative Parameters of Glottal Area Waveforms and High-speed Kymography in Healthy Individuals2016
Author(s)
Tsutsumi, M., Isotani, S., Pimenta, R.A.., Daier, J.E., Hachiya, A., Tsuji, D.H., Tayama, N., Yokonishi, H., Imagawa. H., Yamauchi, A., Takano, S., Sakakibara, K.-I., Montagnoli, A.N.
-
Journal Title
J. Voice
Volume: In press
Pages: 1-9
DOI
Peer Reviewed / Open Access / Int'l Joint Research
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] 外鼻の音響特性の予備的分析2017
Author(s)
竹本浩典, 北村達也, 山口徹太郎, 槇宏太郎
Organizer
日本音響学会平成29年度春季研究発表会
Place of Presentation
明治大学生田キャンパス (神奈川県川崎市)
Year and Date
2017-03-15 – 2017-03-17
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-