研究課題/領域番号 |
23700221
|
研究機関 | 山梨大学 |
研究代表者 |
森勢 将雅 山梨大学, 医学工学総合研究部, 助教 (60510013)
|
キーワード | 音声明瞭化 / 音声分析 / 音声合成 / 音声知覚 |
研究概要 |
目標の1つとしていた雑音環境下における音声の明瞭化を実現するため,スペクトルサブトラクション法を改良した雑音の抑圧法を提案した.提案法は人間の聴覚特性の1つである等ラウドネス曲線に基づいて雑音を減算することで,従来法で問題となっていた雑音抑圧後に発生する耳障りな音であるミュージカルノイズの抑圧を実現した.従来法と比較した客観・主観評価により,提案法は,ミュージカルノイズを抑圧しつつ,音声を強調できることが示された. 次いで,声帯に異常がある音声や歌声におけるシャウトや力みを含む音声,高齢者のしゃがれ声等でしばしば生じるサブハーモニックを検出するための方法を提案した.これらサブハーモニックは音声に独特の響きを与え明瞭度を損なう原因になることから,明瞭化を実現するためには除去することが望ましいといえる.本年度では,この現象が声帯振動の時間・振幅における変調であることに着目した検出法を提案した.実際にサブハーモニックを含む音声が収録されたデータベースを用いた評価実験を実施し,期待通りサブハーモニックが検出できることを確認した. 最後に,より多くの音声を高速に分析することを目的とし,基盤となる音声分析合成方式の計算コスト削減を目指したアルゴリズムの改良,および,多様な音声を分析合成するために,音声分析により抽出される特徴パラメタの一部見直しを行った.現在の音声分析合成方式では,基本周波数,スペクトル包絡に加えて声のかすれ具合に相当する非周期性指標を用いている.本年度は非周期性指標に代わる分析パラメタとして,残余信号,励起信号,群遅延,位相を音声から抽出するための方法についてそれぞれ検討した.これらの特徴パラメタから音声明瞭化の観点から最も適したものを選定することが次年度での課題となる.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究で設定している計画は概ね期待通りに進められているといえる.音声明瞭度評価用の音声データベースについては,まだ有効性の検証は完了していないものの収録自体は完了している.一方,現段階で400単語以上存在するため聴取実験の際に被験者に大きな負担を強いる状況である.被験者の集中力が正答率に影響することも考えられるため,単語数については吟味し評価時間が20分程度になるよう単語を選定する必要があるといえる. 音声明瞭度の改善に関する検討は計画通りに進んでおり,雑音環境下における明瞭化技術は完成したといえる.現在は発話そのものの明瞭化を改善する技術の開発に取り組んでいるが,若年者同士でも発話スタイルにより会話が困難な場合にも対応可能となる明瞭化技術の構築を目指した検討を実施している.高齢者のしゃがれ声を若年者の声に変換する技術についてはまだ完成していないが,しゃがれ声の特徴は明らかになったため,その特徴を通常発話のものに変換することで目標は達成できると考えられる. 音声分析合成器の特徴パラメタの選定についても今後検討を進める.ただし,現在のTANDEM-STRAIGHTで採用している非周期性指標を用いた場合においてもある程度の変換は可能であることが想定される.新たな特徴パラメタを策定することに成功すれば,当初の予定を上回る成果となりうる. 年度の途中で所属が変わったため主観評価を行うための被験者集めについては最終年度の大きな課題となる.前年度の実験は完了しているが,同じ被験者での実験は不可能であることから,被験者の能力検査等を含めてやり直すため,計画がやや遅れる可能性がある.最終年度では効率良く研究を進めることでこれらの遅れに対処するようにペースを上げて研究を進める.
|
今後の研究の推進方策 |
最終年度では,本年度までの成果を統合し最終目的である音声明瞭化技術の実現を目指す.各手法を評価するため,音声明瞭度を評価するための音声データベースを完成させ有効性について評価する.本データベースは,被験者の知識レベルに依存せず同じ正答率を出力し,特定音素に対する偏りが存在しないことを前提に単語リストを選定している.まず,本データベースが期待通りに働くか否か検証する.検証が完了し有効性を確認した後に,本データベースを用いて提案法を評価する.類似したデータベースも存在するため,本データベースの優位性はこれら従来のデータベースと比較して検証する. 音声の明瞭化については,前年度までに検討した方法に加え,「聞き取りにくい発話は口の動きが小さい」という知見に着目した新たな制御法を実現する予定である.具体的には,まず,音声から声道形状の時間変化を計測し,不明瞭な音声と明瞭な音声による違いの検証を行う.次いで,不明瞭な音声の声道形状の時間変化を明瞭な話者のそれに合わせることで,音声を明瞭化する.本技術は,高齢者の発話を若年者に近づける効果が期待されるだけではなく,発話が不明瞭な若年者の音声も明瞭化可能なことが見込まれる.前年度に提案したサブハーモニックの特徴抽出からサブハーモニックを取り除く技術についても同様に検討する.最終的にはこれらの技術を組み合わせた1つの音声明瞭化技術として実装し,構築された音声データベースを用いて有効性の検証を行う. これは本計画にはないが,会話にあたり相手に好印象を与える話し方や声質があることから,会話中からそれらの「印象」を抽出するための方法についても検討する.これは,発話トレーニングにより「感じの良い声」を作り会話を促進するために役立つものと思われる.
|
次年度の研究費の使用計画 |
平成24年度研究費の一部は,25年度に発表する予定となる国際会議ICA 2013 (International Congress on Acoustics)の旅費の一部として繰り越すこととした.これは,平成24年度の成果が当初の予定より多く得られたため,一部の成果報告を次年度で行うことにしたことが原因である.本研究成果は,すでに上述の会議での採録が決定している,平成25年度に計画している成果報告用の旅費のみでは,本発表以外の成果を全て報告することが困難だと判断した.したがって,平成24年度の予算における他の費目を圧縮しすることで次年度の旅費をねん出し,次年度に繰り越すこととした.
|