2017 Fiscal Year Research-status Report
雑音環境下で頑健に動作するサイレント音声通話技術の構築
Project/Area Number |
15K12064
|
Research Institution | Nagoya University |
Principal Investigator |
戸田 智基 名古屋大学, 情報基盤センター, 教授 (90403328)
|
Co-Investigator(Kenkyū-buntansha) |
中村 哲 奈良先端科学技術大学院大学, データ駆動型サイエンス創造センター, 教授 (30263429) [Withdrawn]
サクリアニ サクティ 奈良先端科学技術大学院大学, 先端科学技術研究科, 特任准教授 (00395005) [Withdrawn]
Neubig Graham 奈良先端科学技術大学院大学, 先端科学技術研究科, 助教 (70633428) [Withdrawn]
|
Project Period (FY) |
2015-04-01 – 2019-03-31
|
Keywords | 音声等認識 / サイレント音声 / 音声合成 / 音声変換 / 信号処理 / 統計処理 |
Outline of Annual Research Achievements |
周囲に聴取困難なほど微弱なささやき声によるサイレント音声コミュニケーションの実環境下への適用を目指し、外部雑音に対して頑健に動作するサイレント音声通話技術の研究開発に取り組んだ。 1.雑音環境下における明瞭性の高い変換音声の実現を目指し、前年度に引き続き、通常音声からロンバード音声への統計的変換処理に関する検討を行った。その結果、統計的変換処理では十分な明瞭性改善効果が得られないことを実験的に明らかにした。この結果に基づき、統計的変換処理ではなく、信号処理に基づく波形加工処理をベースとした明瞭性改善手法の構築に取り組んだ。従来の波形加工処理に対して、外部雑音の統計量を加味した改善を施すことで、単純な信号処理で高い明瞭性改善効果が得られる波形加工処理を実現した。実験的評価を実施し、様々な雑音環境下において、提案法は高い明瞭性改善効果が得られることを明らかにした。 2.前年度構築した体内伝導音声認識システムの改良に取り組んだ。具体的には、深層学習に基づく体内伝導音声認識システムに対して、発話様式適応処理、話者適応処理、ならびに、外部雑音環境適応処理を導入した。実験的評価を実施し、話者適応処理および外部雑音環境適応処理の有効性を確認した。 3.これまでに構築してきた要素技術に基づき、テストベッドシステムの構築に着手し、外部雑音モニタリング機能を備えた体内伝導音声収録装置を構築した。 4.これらの研究成果について、研究発表を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
個々の要素技術の構築に関する研究は順調に進めることができたが、最終のテストベッドシステムの構築および評価に関して、研究遂行に想定以上の時間を要することが分かった。しかしながら、研究代表者の大学業務の多忙に伴い、十分な時間を捻出することが出来ず、十分な研究成果が得られなかった。
|
Strategy for Future Research Activity |
研究期間を1年延長してテストベッドシステムの構築および評価に取り組むことで、本研究課題目標を達成する。
|
Causes of Carryover |
理由:最終のテストベッドシステムの構築および評価に関して、研究遂行に想定以上の時間を要することが判明し、十分な研究成果を得ることができず、対外発表件数が伸び悩んだ。 使用計画:研究期間を1年延長することで、テストベッドシステムの構築および評価を実施する。また、得られた研究成果を対外的に発表する。これらの取り組みを実施する上で、助成金を使用する。
|