研究概要 |
音声の音色・声色は,発話者の発声器官サイズや形状の違いに依存するため,同一内容の発声であっても,音としては異なる。音色の違いは音空間の写像として捉えられるため,写像不変の計量を導出し,それのみを用いて音声を表象すれば,任意の写像(即ち,話者による違い)に対して頑健な音声処理が可能となる。本研究では,1)写像不変量の導出とそれに基づく音声アフォーダンスの提案,2)音声アフォーダンスに基づく孤立単語発声を対象とした音声認識系の構築と,連続音声認識への拡張,3)音声アフォーダンスに基づく外国語発音評定技術の構築と,従来技術との融合,4)音声アフォーダンスに基づく重度自閉症者の行動理解や,幼児の音声模倣に対する情報処理モデルの構築,について検討することを目的としており,特に本年度は,3)についての検討を行なった。外国語発音評価を行なう場合,教師音声と学習者音声をそのまま比較すれば声帯模写の上手下手を判定することになる。そこで,体格や年齢による声色のバイアスを除去した上で発音を表象し,両者を比較する技術を構築し,また従来の声帯模写評価的な,音声の絶対的特性に基づく技術との融合を図った。その結果,体格差に頑健に動作し,また(ミスマッチが少ない場合においても)従来手法より高い精度を示す技術を構築することに成功した。実際にデモシステムを用いた英語発音教育指導などの実践も行なった。これら成果は高い評価を受け,外国語学習に関する国内外の会議にて招待講演をする機会を得た。
|