研究分担者 |
井上 優 国立国語研究所, 日本語教育部門第1領域, 領域長 (30213177)
小河原 義朗 国立国語研究所, 日本語教育部門第1領域, 研究員 (70302065)
椙本 総子 国立国語研究所, 日本語教育部門第1領域, 研究員 (50370995)
佐野 洋 東京外国語大学, 外国語学部, 助教授 (30282776)
佐々木 泰子 お茶の水女子大学, 国際教育センター, 助教授 (20251689)
|
研究概要 |
この研究では,日本語非母語話者の話す日本語発話と,それとほぼ同じ内容の母語による発話とを大量に集めて録音・文字化し,音声データ・文字化データをともに電子化してお互いの間にリンクをはった音声データベースを作成し、それに基づく研究を進めることを目的とする。 今回の計画では,アジア諸言語,特に朝鮮語・中国語(漢語普通話)・タイ語を母語とする話者から集中的にデータを集め,この3言語と日本語についての発話対照データベースを完成させるとともに,このデータベースに基づく対照言語学的研究・日本語教育への応用研究をおこなう。加えてここで得られた知見やデータ整理・分析の方法論を,さらに大規模な多言語音声データベースを作成していくための足がかりとする。 収集するデータの形態は,1)朗読音声 2)課題に基づくスピーチ 3)ロールプレイ 等である。 研究終了時に、以下の規模のデータベースをDVDの形で公開した。 <日本語発話データ> 朗読 1人あたり3データ×10名×4(中・韓・タイ・日)=120データ スピーチ 1人あたり4データ×10名×4=160データ ロールプレイ 1組(2人)あたり4データ×5組×4=80データ 計:360データ <学習者の母語発話データ> 朗読 1人あたり3データ×10名×3(中・韓・タイ)=90データ スピーチ 1人あたり4データ×10名×3=120データ ロールプレイ 1組(2人)あたり4データ×5組×3=60データ 計:270データ 総時間数:約29時間 データサイズ:約4GB
|