研究課題/領域番号 |
24300073
|
研究機関 | 和歌山大学 |
研究代表者 |
河原 英紀 和歌山大学, システム工学部, 教授 (40294300)
|
研究分担者 |
入野 俊夫 和歌山大学, システム工学部, 教授 (20346331)
西村 竜一 和歌山大学, システム工学部, 助教 (00379611)
戸田 智基 奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90403328)
坂野 秀樹 名城大学, 理工学部, 准教授 (20335003)
榊原 健一 北海道医療大学, 心理科学部, 准教授 (80396168)
森勢 将雅 山梨大学, 大学院医学工学総合研究部, 助教 (60510013)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | 音声分析 / 音声変換 / 音声合成 / 標本化 / 心理実験 / 音声生成 / 発声評価 / 音声訓練 |
研究概要 |
本研究計画では、(1) 音源情報の精密な分析合成技術、(2) 疎な表現からのスペクトル形状復元技術、(3) 汎用情報基盤へのツール群の実装、という3 つの目標の実現に向けて、(1) 基盤となる理論の構築とアルゴリズムの開発、(2) 汎用情報基盤に適したアルゴリズムと実装技術の開発、(3) 評価用データベースの 構築および評価用応用アプリケーションの開発、(4) 客観評価実験および主観評価実験の遂行、を担当するグループにより、相互の密接な連携の下に研究を進めた。その過程で、これまで未解決であった一段階の直接的処理により、任意の個数(人数あるいは表現)の音声の物理属性を個別に、時刻に応じて異なった重みで合成して、しかも客観的にも主観的にも破綻しない形で実現することのできる原理を明らかにした。さらに、この原理に基づいたシステムを実装することにより、実際に動作することを確認した。また、昨年度の発明である高速かつ精密 な音声の基本周波数抽出法を、統計的な手法と統合することにより、汎用実用基盤への適合性の高い、頑健な方法として実装した。さらに、広い年齢層にわたる多人数の音声データベースの分析とMRIによる声道形状測定結果に基づく校正により、音声から発声者の声道長をラベル付けという高価な過程を経ること無く求める方法を実現した。これらの評価用アプリケーションとして、発声訓練システムを開発した。また、前年度に構築した、物理特性が超低域まで厳密に規定されている音声収録系を用いて、従来の分析法では分析が困難な多様な発声による音声の収録を進めた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
基礎アルゴリズムとモーフィングに当初想定していなかった画期的な発明と発展が再び生じた。このような画期的な進展は、予想および計画す ることが困難なものであるが、その結果、本研究が大きく進展することとなった。大規模なデータベースとMRI計測による客観的な物理情報を用いることにより、それ自体有用性の高い評価用アプリケーションを実現することもできたことは、本課題の成果を当初の想定を超えたインパクトの大きなものとする可能性を更に強化するものであり、当初計画以上に進展しているとの評価につながった。
|
今後の研究の推進方策 |
今回の2つの本質的な発明と発展ならびに、さらに、現在形を成しつつある新たな2つの大きな発明を活用することで、当初計画を更に大きく成果を生み出すことを狙う。また、次年度は最終年度であることから、発展の状況に応じて、さらにそれらの成果を展開するための、次に続く企画についての検討を進める。
|
次年度の研究費の使用計画 |
基盤となる音声分析技術ならびにその基盤の上に構築されたモーフィングに画期的な進展があったため、そのアルゴリズムの確立と実装に重点を置いた。分析に用いるデータベースの構築に際し、それらの進展を考慮に入れた収録が必要と判断し、本格的なデータベースの収録と、それに基づく分析、主観評価実験を翌年度に行うこととした。 本年度の画期的な進展を考慮に入れて、本年度予定していた計画を次年度に行うこととし、具体的には、本格的なデータベースの収録を行うとともに、それに基づく分析、主観評価実験を行う。
|