研究分担者 |
広瀬 啓吉 東京大学, 大学院・情報理工学系研究科, 助教授 (50111472)
原田 康也 早稲田大学, 法学学術院, 教授 (80189711)
河内山 晶子 中部大学, 人文学部, 助教授 (80350990)
山内 豊 東京国際大学, 商学部, 助教授 (30306245)
牧野 武彦 中央大学, 経済学部, 助教授 (00269482)
|
研究概要 |
語学教育において,学習者の対象言語に対する言語知識及びその運用能力を客観的に記述する枠組みが求められている。本研究では,英語の発音学習に焦点を絞り,現在の発音がどのような状態にあるのか,優先的に矯正すべきはどの音素の発音なのか,また,日本人の英語発音はどのようなタイプに分類できるのか,といった情報を,学習者の音声データから高精度に抽出する技術体系について基礎検討を行なった。音声の音響的特徴に基づいて発音状態を記述する場合,発音と無関係の要因,例えば,性別や年齢に伴う音響変動は,発音の記述方式に影響を与えないようにすべきである。音声の非言語的情報を分離した上で音声を表象することが必要である。音的イベントを全て分布として表現し,任意の2イベント(分布)間距離をバタチャリヤ距離として求める。全ての分布間距離を求めるということは,その分布群で張られる幾何学構造を規定することに等しいが,この分布群構造が話者や音響機器による音響歪みに影響を受けない音声表象となることが数学モデルの上で示される(音響的普遍構造)。この構造的表象を用いて学習者の英語母音構造を求めた場合,話者,性別,年齢といった要因が消え,母音生成における不具合が,構造的歪みとして計算される。音そのものを見ること無く,音と音の関係のみを捉えることで,1)学習者の発音の上達過程を随時記録していくことが可能であること,2)個々の母音の一回ずつの発声でその発音状態が推定可能であること,3)複数の学習者の発音状態を直接比較することが可能であること,4)と同時に,複数の学習者群を発音状態の類似性に基づいて分類することが可能であること,5)優先的に矯正すべき母音がどれであるのか,についての教示を生成することが可能であること,を実験的に確認した。音声データ収録についても,大学公開を利用して約250名の英語音声を収録し,それらを分類することを試みた。
|