22年度は母音カテゴリー獲得のシミュレーションに、トップダウン情報を導入した場合どのような結果が得られるかを検討した。まず、子音カテゴリーの獲得のために構築されたモデルで、生成音韻論に基づいたトップダウンの情報を活用し、個別音素ではなく前後の母音や子音の情報をトップダウンに利用することでカテゴリーの学習が飛躍的に向上することを示したモデルを検討した。このモデルを母音にも拡大し、当チームで構築した日本語の対乳児音声の発話を入力として母音カテゴリーを獲得する場合トップダウン情報がどのような役割を果たすのかを検討した。残念ながら、このモデルが母音のカテゴリーを学習するためには、大規模な入力が必要で、我々が構築したコーパスではサイズが不足していることが分かった。 次にサマースクールインターンシップ制度を利用して来日した米国スタンフォード大学の大学院生との共同で、日本語対乳児会話コーパスに含まれるすべての長母音、短母音を抽出しその持続時間を計測し、日本語の対乳児音声に含まれる長母音と短母音はどのような分布を示すのかを検討した。その結果、長母音の分布は短母音の分布に完全に包括されることが分かった。これは、母音の持続時間のみを指標にして、日本語には長母音と短母音が独立したカテゴリーとして存在するということを学習するのは不可能であることを示している。しかし、発話内での母音の位置、アクセントの有無などのトップダウン情報を加味すれば、長母音と短母音が異なるカテゴリーとして学習可能であることも分かってきた。現在は、これらの結果をこれまで研究分担者らが構築してきたSOMモデルや、その他の既存の数理モデルを利用したシミュレーションを行い、実際の乳児の発達により近いものは何であるのかを検討している。 研究成果は音響学会、InterSpeechなどで発表したが、一部の成果については現在論文として執筆中である。
|