2004 Fiscal Year Annual Research Report
Project/Area Number |
16520362
|
Research Institution | Ritsumeikan University |
Principal Investigator |
朝尾 幸次郎 立命館大学, 文学部, 教授 (40102462)
|
Keywords | 英語 / 学習 / コーパス / コンコーダンス / KWIC / データ駆動型学習 / 発見学習 / 用例 |
Research Abstract |
英語学習者が学習の過程で利用できる「学習用英語コーパス」を作成するため、インターフェースの開発、英文テキストデータの収集、吟味を行った。 成果は公開での利用を目的とするため、Web上で利用できるしくみを開発した。検索の手順と画面表示はPerlにより記述したCGIにより実現した。利用者は中学生〜大学生を想定している。このため、KWICコンコーダンスについて知らなくても、また、使い方の説明を読まなければ利用できないことがないよう、直感的に理解できる工夫をほどこした。この結果、あらかじめ左、または右ソートされた用例がフルセンテンスで表示できるインターフェースを実現した。 検索の対象となる英語テキストはこの成否にもっとも深くかかわる部分であるため、吟味には慎重を期した。もっとも大きな壁は著作権であった。高校の英語教科書はわが国の英語学習のレベルを示すよい指標ではあるものの、著作権が入り組んでおり、現実的に利用するのはむずかしいとわかった。このため、高校レベルで利用されている副読本を中心に英文テキスト利用の交渉を進めた。また、中学校レベルの英語としては高校入試に出題された英語も組み入れた。高校の入試問題に利用される英語は中学校レベルの英語をよく代表しており、今回の目的にそっていた。 当初、予期していなかった課題としてうかびあがったのが、テキストの分類である。収集できた英文テキストは学習者向けの比較的やさしい英語ではあったものの、題材により語彙のレベル、分野にかたよりがあるものが相当数みられた。これらをすべて合わせれば、差異は相殺されるものの、出力例が学習用コーパスにふさわしい量を超えることになる。このため、テキストの分類、語彙レベルの特定を行う必要が生じた。この課題は来年度にかけて解決できるよう取り組む予定である。
|