研究課題/領域番号 |
19320081
|
研究機関 | 東京外国語大学 |
研究代表者 |
佐野 洋 東京外国語大学, 大学院・総合国際学研究院, 教授 (30282776)
|
研究分担者 |
芝野 耕司 東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (50216024)
在間 進 東京外国語大学, 名誉教授 (30117709)
馬場 彰 東京外国語大学, 名誉教授 (90033406)
藤村 知子 東京外国語大学, 留学生日本語教育センター, 准教授 (20229040)
|
キーワード | 日本語コーパス / 英語コーパス / コーパス検索システム / 語学教育 / e-Learning教材 |
研究概要 |
本年度(2009年度)、日本語コーパスの増強を行った。すでに集積しているコーパス(日本で販売されている1400冊の教科書の内、指導書等の電子データのある教科書170冊から収集)のカタログを再調査し、教科バランスと絶対的に不足していた科目(数学、英語、音楽等)の指導書を購入し(52冊を追加し)、プログラムを用いてテキスト化を行った。テスト問題やドリルなどについてもテキスト化を行った。同時に、教科書データの特徴比較のため家電製品のマニュアル文章のテキスト化も実施し、両コーパスの文末表現の比較を行った。また、日本語教科書データの検索システムの改良を実施した。 英語教材作成のためのツールとして、Google 5 gram英語データ(1兆語)を使った検索システムを構築した。このシステムは、RDB(Relational Data Base)を用いて検索を行う。用例検索では制限された正規表現を扱うことができる。なお、Google 7 gram日本語データ(2500億語)についてはデータを購入し、英語の検索システムに準じて検索システムとして実装することができることを確認した。 英語への翻訳難易度の視点から、日本語従属表現の定性分析を実施した。従来の翻訳指導書だけでなく日本語教育でも、意味解釈の複雑さが指摘されている、日本語の連用形について、英語翻訳のための類型の調査と、類型を判断するための言語テストの方法を確立した。
|