2014 Fiscal Year Annual Research Report
Project/Area Number |
23320120
|
Research Institution | Waseda University |
Principal Investigator |
岡村 三郎 早稲田大学, 国際学術院, 教授 (30009724)
|
Co-Investigator(Kenkyū-buntansha) |
LANGE Willi 早稲田大学, 商学学術院, 教授 (40277752)
|
Project Period (FY) |
2011-04-01 – 2015-03-31
|
Keywords | コーパス言語学 / コーパス構築 / データ駆動型 / ドイツ語基本語彙 / ドイツ語教育 / 辞書論 / 造語論 |
Outline of Annual Research Achievements |
本研究はインターネットの大規模なテクスト情報を利用し、ドイツ語の基本語彙を方法論的に客観的に確定し記述することを目的とする。その研究結果はドイツ語の学習及び教育の役に立つ。研究結果はインターネット上に公表し、多くの人が利用できるようにする。 研究手法としては厳密なコーパス言語学の方法(データ駆動型、大規模情報の処理)を使い、基準コーパスの科学的な信頼性を高いものにする。ドイツ語のプリントメディア並びにインターネットフォーラム等のコーパスを使い、約8億5千万語からなる十分大規模なコーパスを構築した。方法的な客観性と透明性を保証するために、見出し語の出現頻度、安定性、生産性の3基準をコーパスに適用し基本語彙のランキングリストを作り、結果は部分的にすでにネット上で提供している (http://www.basic-german.com/)。 さらに基本語彙に関し適切な例文を選び出すために、共起および例文の困難度(例文の中にこれまで得られた基本語彙が現れる度合い)を基準とし、基本語彙にふさわしい例文を選出し、例文のリストを完成した。これらのデータは全て、既にオンラインデータバンクに入力されている。それを元に学習用基本語彙のための適切な例文を選び、それに日本語の訳を付け基本語彙辞典編纂の作業を行っている。我々はとりあえず上位数千語までに、その語の基本語彙ランキング、語形の記述、意味のドイツ語、日本語での記述、コーパスから選んだ例文、そしてその訳等をつけるつもりである。現在は1000語まで記述が完成し、さらに暗記用のフラッシュカードもhttp://basic-german.com/beta/で検索可能な状態にある。 なおコーパス駆動型研究のもたらした興味深い知見(とりわけ既存の基本語彙との差異について)も含めこれまでの成果全体について報告するために共同で論文を執筆した。
|
Research Progress Status |
26年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
26年度が最終年度であるため、記入しない。
|