研究課題/領域番号 |
16H05899
|
研究機関 | 山梨大学 |
研究代表者 |
森勢 将雅 山梨大学, 総合研究部, 助教 (60510013)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
キーワード | 教育工学 / 音声情報処理 |
研究実績の概要 |
本研究では,人間が発話する音声から好感度に相当するパラメータを抽出・制御する技術を開発し,発話トレーニングの自動化へ活かすことを目標としている. 本年度は,音声から知覚する好感度を計測するための主観評価実験を実施した.好感度のように,被験者により好みが分かれる可能性が高い心理パラメータを扱うため,まずは,女性発話に限定して,被験者の性別に差が生じるかについて検討した.女性21名の話者を対象に行われた主観評価の結果,男女で好感度の高い(あるいは低い)話者の傾向が異なることを確認した.その後,音響特徴量との対応付けを実施し,女性被験者についてはフォルマント周波数やスペクトル傾斜などの物理パラメータと好感度との間に有意な相関が認められることを確認した.男性被験者では,スペクトル傾斜についてのみ,女性とは逆に傾向にあることが確認された.つまり,男女の好感度の差はスペクトル傾斜に起因する可能性が示唆されたといえる. 次いで,次年度以降実施する評価実験に用いる音声データベースを構築した.本音声データベースは,テキスト情報から感じる好感度についてもばらつくように多様なテキストを選定した.具体的には,高校の教科書などを対象に300文章を選定し,その後,主観評価により,平均的に好感度の高い・低い・普通の3段階についてそれぞれ10文章選定した.発話者は男女各10名として収録実験を実施した.その際,各テキストについて,各々の発話者が想像する好感度の高い(低い)音声で発話させた.これにより,発話者は好感度を上げる(下げる)際にどのような音響パラメータを制御するかが明らかになる. 今後の検討には高精度な音声分析技術が必要となるため,現在我々が有する世界最高峰の音声分析合成システムWORLDのアルゴリズムを改良した.特に,音声の高さに相当する基本周波数推定において,耐雑音性を高めることに成功した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
音声分析合成システムを改良し,本研究プロジェクトを遂行するために必要な精度を確保した.好感度計測実験については,被験者の性別により好感度の高い(低い)音声が異なるという結論が得られたため,早急に論文としてまとめることにした.音声データベースの構築や,好感度を時系列で評価することについても進めており,2017年度の早い時期に学会で成果報告をする予定である.概ね期待どおりの成果を期待どおりの時期に得られたため,順調に進展しているといえる.
|
今後の研究の推進方策 |
まず,構築した音声データベースを解析し,発話者視点で好感度を制御する際にどのような音響パラメータを制御するかについて調査する.本データベースには,発話するテキストについて,テキストのみから知覚する好感度についても高い・低い・普通の3段階に分けているため,発話音声のテキストが知覚する好感度に与える影響も調べることが可能となる.これらの評価から,目標となる発話改善についてどのようなアドバイスを行うべきか検討する. 発話音声の時系列評価を行い,音声全体の好感度評価と時系列評価との差を比較することで,発話のどの部分が全体の好感度に影響するかを明らかにする.特に,音声波形を入力とし,好感度を出力することで,現在の発話好感度をフィードバックする好感度計測モデルの構築にも取り組む.
|