Co-Investigator(Kenkyū-buntansha) |
上村 俊彦 県立長崎シーボルト大学, 国際情報学部, 教授 (50176640)
望月 正道 麗澤大学, 外国語学部, 教授 (90245275)
投野 由紀夫 明海大学, 外国語学部, 教授 (10211393)
杉森 直樹 立命館大学, 情報理工学部, 助教授 (40216338)
石川 慎一郎 神戸大学, 国際コミュニケーションセンター, 助教授 (90320994)
|
Research Abstract |
JACET8000を学習語彙表として様々な観点から検証した結果,信頼性・妥当性とも高い語彙表であることが明らかになった。当初は,現在の8000語を10000語に拡充しようという計画であった。しかし,調査の結果,頻度が特に重要と思われるのはほぼ5000語あたりまでで,それよりも頻度が低い語彙は,頻度をベースにした語彙表よりも,学習者の専門領域を加味した語彙学習表を作成することが必要であるという結論に到った。 さらに,検証の結果,JACET8000に挙げられた語彙も,おもにBNCに基づいて頻度をつけたため,若干Queen's Englishへの偏りが認められた。また,仮に米国中心の大規模コーパスで語彙表に挙げた単語の頻度をつけ直した場合,語彙表に挙げた語彙の頻度がどのようになるか,という新たな疑問が発生した。そこで,当初の研究目的を若干変更し,JACET8000を他の大規模コーパスを加味して頻度を算出した場合,どのように頻度順位が異なるかを調査することを今年度以降の研究目的とすることにした。 そこで,データ処理・分析に必要な既存の言語処理ソフトを収集・整備し,清水伸一氏(安城学園高校)に,本研究に特化したperlスクリプトの開発を依頼し,各研究分担者が分析方法を習得した。さらに,大規模コーパスを購入し,検定教科書その他の言語資料を収集して整備した。 現在の作業状況は,科研報告書の前半の部分を執筆し,JACET8000の評価をまとめている。また,大規模コーパスを分担し,拡大規模コーパスに収められた言語資料をperlを使ってデータを取り出す作業にかかっている。
|