研究課題/領域番号 |
24820041
|
研究機関 | 駒澤大学 |
研究代表者 |
三木 望 駒澤大学, 総合教育研究部, 講師 (00632100)
|
研究期間 (年度) |
2012-08-31 – 2014-03-31
|
キーワード | 日本人学習者 / パラレルコーパス / 添削文 / ライティング |
研究概要 |
日本人学習者の英作文とその添削文から構成されるパラレルコーパスを作成するために、NICE (Ver. 2.1.2) から342のテクストの添削文を計53人の英語母語話者によって3通り作成している(総計1026テクスト)。当初は、異なる3人の英語母語話者によって一つの添削文を作成する予定であったが、添削者個人の要因を明確にした方が良いという専門家の助言を受けて、1つのエッセイにつき3人の校正者によって3通りの添削文を作成した(342テクスト×3)。3通りの添削文のデータベースは、個人の癖が疑われる場合に、他の二つで確認することができる点で意義が大きい。 同様に、3人の校正者がETSのCriterionの6段階評価の基準に基づいてそれぞれのテクストにつけたスコアの中央値を採用して、テクストのレベル分けを行っている。こうしたスコアによって、TOEIC, TOEFL などの習熟度情報がないテクストに関しても、レベルごとの特徴が判明できるようにした点は重要である。また、コメントもついているので活用が期待できる。 テクストの整形では、前後の文と接続詞などで連結した方がよい場合は、特別にMERGというタグを用いて、2文を連結した添削文を作成させて、それに対応する元の文の対応付けを手作業で行った。これによって、単文レベルの添削に留まらず、複文にまたがる添削を扱うことが可能になり、日本人学習者が短い文を用いるが、添削文では長い文を用いていることを示すことが可能になった点で重要である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
研究の進行が遅れている理由は、当初の3人体制で1つの添削文を仕上げる方法から、3人の校正者がそれぞれ1つの添削文を作成する方法に変更して、添削文の数が3倍になったためである。3人体制と異なり、校正者が1人で添削を行っているため、添削文の誤植が予想以上に多く、誤植等を確認して、担当した校正者に訂正させ、不適切な添削のやり直しを行うのに時間を要して、パラレルコーパスの作成に遅れが生じたことも理由の一つである。現在、添削文の3セットのうち1セットの誤植の確認・訂正とオリジナルの文との対応付けが完了している。そして、原因と結果に関する接続詞や副詞の質的分析を開始して、従来指摘された過剰語がどのように添削で訂正されているかが判明してきている。量的分析(特徴語分析、連語など)は、3セットの添削が全て完成していないので、まだ行っていない。
|
今後の研究の推進方策 |
6月中に全データの添削文のパラレルコーパスの作成(即ちオリジナルの文と添削文の対応付け)を完了して、量的分析(特徴語分析・連語)を行う。接続詞を中心に複文の対応関係を調べる。添削文のコーパスの他にNICEの英語母語話者のエッセイのコーパスと比較して、学習者に特有な語彙の使用を調べ、そのフィードバックとして添削文のパラレルコーパスがどのように役立つのかまとめる。分析と並行して、ソフトウェアの制作者に依頼して、パラレルコーパスのソフトウェアの開発と公開を進めていく。
|