1994 Fiscal Year Annual Research Report
Project/Area Number |
06610425
|
Research Institution | Hokkaido University |
Principal Investigator |
園田 勝英 北海道大学, 言語文化部, 助教授 (70113694)
|
Keywords | コーパス / 文法的タグ / 英語史 / Margaret Paston / SGML |
Research Abstract |
英語の歴史的コーパスの構成法の研究のため、材料としてMargaret Pastonの書簡を選んだ。このためのタグの設計を平成6年6月段階で一応終了した。タグとしては水平タグと言われる方式を採用した。文法式タグの理論的根拠としてはChomsky(1986)Barriersを選んだ。通常のエディタ-を用いて手作業でタグを埋め込むために、タグの視認性にも考慮した。 Margaret Pastonの書簡は全部で67,000語であるが、これに対するタグ付けの作業が終了した。これをもとに文法分析を開始している。主節と従節における様々な文法現象の相違を観察する作業を行っている。 また、現代綴りと異なる綴りの語の後にはタグの一部として現代綴りを付けている。これを基に綴りの分析を試行したところ、満足出来る結果が得られた。 現在、研究は予定通り進行している。タグセットの設計に当たっては、文法的タグとSGMLとの共存の問題が生じた。SGMLは表題、章、節、段落などのテキストの外的構造を明示するシステムで、最近はOxford Text Archiveが提供する各種電子テキストにも用いられ、この種のものとしては標準になっている。文法的タグセットはSGMLのタグセットと共存することが望ましい。本研究において当初このSGMLは考慮されていなかった。本研究で提案する文法的タグセットをできるだけSGMLと親和性のよいものとするよう改良をくわえることも行った。
|