研究課題/領域番号 |
24300073
|
研究種目 |
基盤研究(B)
|
研究機関 | 和歌山大学 |
研究代表者 |
河原 英紀 和歌山大学, システム工学部, 教授 (40294300)
|
研究分担者 |
入野 俊夫 和歌山大学, システム工学部, 教授 (20346331)
戸田 智基 奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90403328)
坂野 秀樹 名城大学, 理工学部, 准教授 (20335003)
榊原 健一 北海道医療大学, 心理科学部, 准教授 (80396168)
森勢 将雅 山梨大学, 大学院・医学工学総合研究部, 助教 (60510013)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | 音声分析 / 音声変換 / 音声合成 / 標本化 / 心理実験 / 音声生成 / 発声評価 / 音声訓練 |
研究概要 |
本研究計画では、(1)音源情報の精密な分析合成技術、(2)疎な表現からのスペクトル形状復元技術、(3)汎用情報基盤へのツール群の実装、という3つの目標の実現に向けて、(1)基盤となる理論の構築とアルゴリズムの開発、(2)汎用情報基盤に適したアルゴリズムと実装技術の開発、(3)評価用データベースの構築および評価用応用アプリケーションの開発、(4)客観評価実験および主観評価実験の遂行、を担当するグループにより、相互の密接な連携の下に研究を進めた。その結果、音声の分析において高速かつ精密な基本周波数抽出法を発明するとともに、新たな標本化理論に基づいて、ボトムアップの方法であるSTRAIGHTに、疎な表現でありトップダウンの方法である線形予測分析を新たな形で結びつける可能性を見いだした。また、重点項目であった音源情報に関しては、非周期成分の表現を改良することにより、品質を改善することに成功した。また、基盤技術としてのモーフィングをサポートする相対的声道長の新しい推定法を発明することにより、100倍以上の高速化と推定精度の向上を達成した。さらに、これらのアルゴリズムを応用することを促進することを狙い、実装の汎用化を進めた。また、プラットフォームとして、タブレットを導入し、試験的評価を開始した。評価用データベースの構築に関しては、物理特性が超低域まで厳密に規定されている音声収録系を構築し、従来の分析法では分析が困難な多様な発声による音声を収録し、整備を開始した。これらに加え、主観実験を効率的に遂行するとともに統一的な分析が可能となる一般化線形モデルとの整合性の良い、実験用のシステムを開発した。これらは次年度以降の本格的な実験を効率的に進める上での重要な基盤となる。また、本課題で得られた成果は、適宜、国際会議などの機会を利用して公開するとともに、社会への還元に努めた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
基礎アルゴリズムに当初想定していなかった大きな発見があった。このような発見は、予想および計画することが困難なものであるが、その結果、本研究が大きく進展することとなった。データベースの収録については、本格的収録に移行するための準備が、前述の発見もあり、十分に整備された状況にあることとなった。これらを総合し、当初の計画以上に進展していると判断する。
|
今後の研究の推進方策 |
今回の発見ならびに、現在形を成しつつあるもう2つの大きな発明を活用することで、当初計画を更に効果的にすることを狙う。
|
次年度の研究費の使用計画 |
次年度は、データベースの収録および評価実験、ならびに成果発表への使用が中心となる。また、成果のタブレット端末への実装のための準備を進める。
|