研究概要 |
日本の児童英語教育の基礎となる語彙表を開発するという研究目的に従い,初年度は基礎的なデータ収集および,暫定的リストの構築を行った. 1.児童用英文テクストコーパスの構築 海外の児童が遭遇する可能性が高いテクストジャンルとして「児童文学」を選び,各種ネットリソーシーズなどを活用し,500万語の大型英文コーパスを構築した. 2.母語発信テクストコーパスの構築 児童への言語教育を考える場合,成人向け言語教育以上に,発信・自己表現の要素が重要になる.そこで,日本の小学生が自然に発信する場合に必要な語彙・トピックを抽出するため,小学生が書いた作文を大量に電子コーパス化した. 3.日本語コーパスの形態素解析 日本語コーパスデータから,個々の語の頻度を抽出するため,形態素解析を実施し,日本語頻度情報を得た. 4.二つの頻度データを融合する手法の研究 英文コーパスの語彙頻度と,母語(日本語)コーパスの語彙頻度をどのように勘案していくかについては.手法はいまだ確立していない.そこで統計的研究をふまえつつ,日本語の形態素を英語に変換し,日本語の語の頻度を英単語頻度に置き換えて,さらに,適正な傾斜比をかけて最終的な頻度順位を決定する手法を考案した. 5.仮リストの構築 上述の手法をふまえ,仮リストを作成した. 6.検証用語彙調査 上述のリストの妥当性を検証すべく,独立した他の言語データ(内外の英語入試データ,中高大生の英語発話データ.辞書の重要語頻度表示など)を利用して語彙分析を行った. 今後は,仮リストの妥当性を検証しながら,実際の小学生からの反応なども取りつつ,本リストの作成につなげてゆく予定である.
|