2017 Fiscal Year Annual Research Report
Development of high-level speech processing infrastructure based on static representations of auditory information
Project/Area Number |
15H02726
|
Research Institution | Wakayama University |
Principal Investigator |
河原 英紀 和歌山大学, 学内共同利用施設等, 名誉教授 (40294300)
|
Co-Investigator(Kenkyū-buntansha) |
西村 竜一 和歌山大学, システム工学部, 助教 (00379611)
松井 淑恵 豊橋技術科学大学, 工学研究科, 准教授 (10510034)
坂野 秀樹 名城大学, 理工学部, 准教授 (20335003)
入野 俊夫 和歌山大学, システム工学部, 教授 (20346331)
森勢 将雅 山梨大学, 大学院総合研究部, 准教授 (60510013)
榊原 健一 北海道医療大学, リハビリテーション科学部, 准教授 (80396168)
戸田 智基 名古屋大学, 情報基盤センター, 教授 (90403328)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 音声分析 / 音声合成 / 感情音声 / 歌声音声 / 障害音声 / 音声情報表現 |
Outline of Annual Research Achievements |
[研究の目的]最先端の音声研究推進のための技術基盤とそれを用いたツール群の整備を目的とする。 [研究の成果]平成29年度は、本課題の基盤としていた音声の情報表現において平成28年度に引続いて画期的な進展が得られた。音声研究の分野では、深層学習による手法が急速に普及し、特定のサービスを目的とする場合には、中間的な情報表現を介さずに応用システムを構築することが可能となっている。本課題でも深層学習に基づくWaveNetを導入することで応用システムによる合成音声の品質を大きく向上させた。しかし、その普及は音声の学術的研究に対して負の影響を与えつつある。本課題により発見/発明された音声の精密な情報表現の分析方法は、この負の影響を解決する位置付けにある。その成果である精密な音声の音源情報抽出法と、分析された音源情報に基づいて音源を生成する際の問題を解決する方法は、旗艦国際会議に採択され、高く評価されている。また、音声知覚研究の強力な研究手段として開発している、時変多属性任意事例数モーフィングを、研究コミュニティーの広い層への普及を促進するため、支援ツールを開発し配布を進めた。これらの活動が注目され、音声研究のハブとしての影響力を増しつつある、シンガポール国立大学に招かれ、国際会議の基調講演と今後の研究協力のための布石を行なった。さらに、平成29年度末には、音声研究のデファクトスタンダードとなっている我々の発明による音声処理基盤の数理的基礎を強固にする発明の萌芽が出現するに至った。このように、本課題では最終年度において、予定を大きく上回りかつ次の画期的な発展につながる成果が得られている。
|
Research Progress Status |
29年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
29年度が最終年度であるため、記入しない。
|
Remarks |
最初の二つは、和歌山大学に用意した、英文での情報発信用と日本語での情報発信用に用意したポータル機能を有するサイト。後の一つは、成果公開用のソフトウェアのGitHubへのリンク。
|
Research Products
(38 results)