研究概要 |
本研究は,これまでにない新しい特徴を持った学習コーパスを構築することを主目的としている.日本人学習者の英語による発話を大量に収集し,コンピューター・データベース化(学習者コーパス化)する研究はこれまでにもなされてきたが,本研究が試みているのは,(1)目標言語(英語)による発話データ,(2)誤りを含むその不完全な学習者発話を母語話者が訂正したデータ,(3)学習者が意図していたことを母語である日本語によって表したデータの3バージョンが並列されている,「パラレル学習者コーパス」の編纂である. 研究初年度である平成18年度は,関連する分野の文献研究や学会への参加により,多くの基礎資料を収集することができた.特に,日本語により学習者から発話意図を引き出す際は,質問者との関係,データ収集時の室内環境,質問の種類等,被験者への心的作用にさまざまな注意を払う必要があることがわかった. それらを踏まえてパイロット的に14名から発話データを収集した.本年度のデータ提供者はいずれも大学生で,およそ2時間にわたる英日両方のインタビューに対応可能であった.懸念事項であったプロトコルに対しても,十分な発話を提供してくれた,それらは既にコンピューター・データベース化されているが,そこで新たな問題事項となっているのが「日本語表現の統一」である. 次年度(平成19年度)は,日本語コーパスや日本語教育分野などの研究を調査し,本研究で利用する日本語表現についての検討を行っていく.また,本データ収集として,100名以上の被験者からのデータ収集を目指し,コーパスの増強を図っていく.
|