2005 Fiscal Year Annual Research Report
Project/Area Number |
16520362
|
Research Institution | Ritsumeikan University |
Principal Investigator |
朝尾 幸次郎 立命館大学, 文学部, 教授 (40102462)
|
Keywords | 英語 / コーパス / 学習 / コンコーダンス / 用例 / データ駆動学習 |
Research Abstract |
1 目的と成果 本研究では英語学習用のコーパスを作成し、公開した。作成したコーパスは学習者が中学校、高校での学習の過程で触れる英語を母集団として定義したものである。いわば「学習用コーパス」という新しい構想である。これにより、高校生が用例を検索しても、たやすく理解できる情報を十分に引き出せるようになった。 2 コーパスの開発 収集した英文データは中学校、高等学校英語副読本によるものである。すべて利用許諾を得てデータ化した。センテンスごとに日本語訳を付し、日本語から英語を、英語から日本語を検索できるパラレル・コーパス化を行った。さらに、和文は単なる和訳でなく、日本語として自然で多様な表現となるよう吟味を重ね、コーパスとしての完成度を高めた。 3 インターフェースの改良 より使いやすくなるようコンコーダンス・プログラムを改良した。学習用のツールであるため、コーパスやコンコーダンスのことを知らない人でも直感的に利用できるよう、よりシンプルに改善し、誤った入力に対応できるようセキュリティーを高めた。 4 テキスト・プロファイリング手法の開発 英文データをコーパス化する途上で、英文の難易度をどのように評価すればよいかという課題が浮上した。同じ高校レベルの英語副読本でも難易度の印象が異なる。学習者にレベルに対応するためには、コーパスデータをそれに対応したものにする必要がある。これを解決するため、英文テキストの性質、難易度を評価する方法としてテキスト・プロファイリングという考えを提示した。たとえば、は難易度については、1文あたりの語数、また、語彙レベルごとの分布などの指標を提示し、その判定は使用者に任せるというものである。 5 レンマ化ツールの開発 テキスト・プロファイリングに必要な、トークンをレンマに変換するための辞書、スクリプトを開発した。
|