研究分担者 |
佐野 洋 東京外国語大学, 外国語学部, 助教授 (30282776)
小河原 義朗 独立行政法人国立国語研究所, 日本語教育部門第1領域, 研究員 (70302065)
井上 優 独立行政法人国立国語研究所, 日本語教育部門第1領域, 主任研究員 (30213177)
佐々木 泰子 お茶の水女子大学, 留学生センター, 助教授 (20251689)
|
研究概要 |
この研究では,日本語非母語話者の話す日本語発話と,それとほぼ同じ内容の母語による発話とを大量に集めて録音・文字化し,音声データ・文字化データをともに電子化してお互いの間にリンクをはった音声データベースを作成することを目的とする.今回の計画では,アジア諸言語,特に朝鮮語・中国語(漢語普通話)・タイ語を母語とする話者から集中的にデータを集め,この3言語と日本語についての音声対照データベースを完成させるとともに,このデータベースに基づく対照言語学的研究・日本語教育への応用研究をおこなう.加えてここで得られた知見やデータ整理・分析の方法論を,さらに大規模な多言語音声データベースを作成していくための足がかりとする. 収集するデータの形態は,1)朗読音声 2)課題に基づくスピーチ 3)ロールプレイ 等である。 本年度は,データ収集の方針・手順を確定し,それにしたがって約100名(200時間)分の発話データを収集した。かつ国内外の日本語教育機関・研究機関に出向いてデータ収録に関する協力を依頼し,多くの機関から快諾を得た。データの大半は国立国語研究所内で収録をおこなったが,一部のデータは国内外の協力者にインフォーマント・録音室の手配をお願いし,研究担当者が現地に出張することによって収録をおこなった。出張してデータ収録をおこなう際のノウハウも蓄積されているので,今後は所外でのデータ収録も積極的におこなう予定である。 収集したデータは日本語・母語データともに文字化作業を進めており,約半分のデータの文字化が完了している。また,文字化データと音声データとの間にリンクをはって相互参照できるようにするシステムについても,試作版を作成中である。
|