研究概要 |
現代スペイン演劇の30の作品を選び,50万語のテキストデータベースを作成した.データベースの形式のままでも検索プログラムなどで言語学的な研究に使用することも可能であるが,あらゆる文脈での特定項目の出現を網羅したり比較するためには総合的ま文脈付きの索引が有用となる.そこで,機能語も含めた総合的なコンコーダンス(つだし言語学的には意味のない固有名詞は除く)を完成させることにした.本年度は次の処理を行った. 1)パーソナルコンピューターによる言語分析用のプログラム(KWICとINDEX)をより汎用性のある形式に改良した. ベルギーのルーバン大学のコック教授との言語コーパスの共同研究でプログラム部門を受け持っているので,IBN機または互換機で動く汎用プログラムを完成する必要があった.一応テストが済み,これで言語データとソフトウェアの交流が可能となった. 2)テキストデータベースをスペイン語の特種文字の表示ができなかっNECタイプのものからIBMの形式に変換した. スペインのラス・パルマス・デ・グランカナリア大学のサンペ-ル教授との共同研究「ラテンアメリカ・スペイン語のマクロ・コーパス」と現在作成中の「スペイン演劇作品」に現われる語彙の比較からスペイン語の地域的なバリエーションの研究が可能である.これについてはこの共同研究の第2の段階で行うことを検討中である. 3)これまでの旧システムによるコンコーダンス(第1分冊から第3分冊まで)の続きとして第4分冊(E),第5分冊(F-K),第6分冊(L)を作成した. 12分冊で完了する予定なので.これでちょうど二分の一を終えたことになる.次の2年間で完成すれば,現代スペイン語の諸相を研究するための基本的な資料となるはずである.
|