研究期間の1年目に相当する今年度は、PCサーバ機をワークステーション代替として試験的にネットワーク上で稼働させ、それを通して、幅広いジャンル・専門分野に属する英語文献データの収集が最大の成果となった。特に米国で発行されている各種の雑誌の記事を体系的に入手し、通常はHTML(Hyper Text Markup Language)で記述されることの多いこれらのデータ文を、プレーンなテキストファイルと自動変換し、得られたファイルに対して、厳密なデータベース化を施すという一連の重要な処理が安定するに至った。 また、雑誌以外にも、ホワイトハウスから配布される米国大統領の演説スクリプトのような口語的性格の強いデータ英文が体系的に収集・加工できたのも大きな収穫と考えられる。科学技術という専門分野に属する英文データの典型として、米国航空宇宙局(NASA)の技術文書を入手・整理し、その他にも、健康問題、教育問題.政治問題等を取り上げたデータ文の蓄積も順調に進行中である。特記すべきは、米国の週刊誌TIME誌が平成8年初頭に配布した。過去68年間に亘る同誌の年頭特集記事“Man of the year“の全てのデータが入手でき、これに対してデータベース化処理が完了したことである。単一ジャンルに属するデータが、これほどまでに通時的に獲得されたのは初めてで、極めて大きな意義を持つものである。即ち、同ジャンル内であっても、時代の変遷に伴って、英語そのものの表現が変化していくという興味深いプロセスを、得られたデータベースを他面的に分析することにより明らかにすることができるのではないかという期待が持てるからである。また、純粋な文学作品というジャンルの典型例として19世紀の英国を代表する作家であるCharles Dickensの長編作品Great Expectations全てのデータベース化も完了し、次年度での綿密な分析の対象となっている。
|