2014 Fiscal Year Annual Research Report
統計的手法と生成過程モデリング手法の融合に基づく音声生成機能拡張技術の構築
Project/Area Number |
26280060
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
戸田 智基 奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90403328)
|
Co-Investigator(Kenkyū-buntansha) |
亀岡 弘和 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, メディア情報研究部, 研究員 (20466402)
中村 哲 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (30263429)
猿渡 洋 東京大学, 情報理工学(系)研究科, 教授 (30324974)
サクリアニ サクティ 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (00395005)
NEUBIG Graham 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (70633428)
川波 弘道 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80335489)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 機能拡張 / 音声合成 / 音声変換 / 信号処理 / 統計処理 |
Outline of Annual Research Achievements |
音声コミュニケーションにおいて物理的・身体的制約により生じている障壁を取り除くために、現存の音声生成過程において併用可能な音声変換基礎技術、および、音声生成機能を拡張する応用技術の構築を目指し、以下の課題に取り組んだ。 調音動作操作機能を備えた統計的声質変換技術の構築(実施計画1):統計的声質変換の基礎技術を拡張し、音声信号からの調音動作パラメータ推定処理、および、調音動作パラメータからの音声信号生成処理を実現し、これらの処理を繋ぎ合わせることで、調音動作操作機能を備えた統計的声質変換技術を構築した。また、調音動作操作時に適切な調音動作を保持するために、調音動作パラメータ補正技術を構築した。 音源生成器官動作操作機能を備えた統計的韻律変換技術の構築(実施計画2):音声F0パターン生成過程の確率モデルを考案し、音声信号からの音源生成器官動作指令推定技術を構築し、動作指令操作による音声F0パターン変換処理を実現した。さらに、言語情報からのF0パターン生成技術も構築した。 調音動作・音声同期収録データベースの構築(実施計画3):磁気センサを用いてリアルタイムに調音動作を収録できる発話観測システムを用いて、調音動作と音声信号の同期収録を実施した。男性話者3名を対象とし、各話者50~100文程度収録した。 音声生成機能を拡張する複数の応用技術の構築(実施計画4):統計的手法に基づく実時間声質変換基盤技術の性能を改善し、音声生成機能拡張技術として、発声障碍者補助技術、外国語発声生成技術、体内伝導音声強調技術、ボーカルエフェクター/ボイスチェンジャー技術に対するベースラインシステムを構築した。 これらの研究成果をとりまとめ、国内外において多数の研究発表を行った。本研究成果は高い評価を受け、国内外において計2つの賞を受賞し、また、国際会議において1件の招待講演を実施するに至った。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
当初の計画は全て実施した。さらに、音声生成機能を拡張する複数の応用技術の構築については、当初計画していなかった応用技術までも構築することができた。
|
Strategy for Future Research Activity |
当初の計画に基づき実施する。また、当初計画していなかった関連研究課題についても、積極的に取り組む。
|
Causes of Carryover |
調音-音声データを1日で複数人収録することが可能となり、発話観測システムの使用回数を減らすことができたため。
|
Expenditure Plan for Carryover Budget |
当初の計画を上回る研究成果が出ているため、国際会議での研究成果発表のための旅費に使用する。
|
-
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] 非母語話者の音声に対する継続長補正の評価2015
Author(s)
倶羅 真也, 高道 慎之介, 戸田 智基,亀岡 弘和, Graham Neubig, Sakriani Sakti, 中村 哲
Organizer
日本音響学会2015年春季研究発表会
Place of Presentation
中央大学後楽園キャンパス(東京都文京区)
Year and Date
2015-03-16 – 2015-03-18
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] 知覚年齢をリアルタイムに制御可能な歌声声質制御インタフェース2014
Author(s)
小林 和弘, 戸田 智基, 中野 倫靖, 後藤 真孝, Graham Neubig, Sakriani Sakti, 中村 哲
Organizer
第22回インタラクティブシステムとソフトウェアに関するワークショップ(WISS 2014)
Place of Presentation
浜名湖ロイヤルホテル(静岡県浜松市)
Year and Date
2014-11-26 – 2014-11-28
-
-
-
-
-
-
-
-
-