2002 Fiscal Year Annual Research Report
Project/Area Number |
11410112
|
Research Institution | AOYAMA GAKUIN UNIVERSITY |
Principal Investigator |
近藤 泰弘 青山学院大学, 文学部, 教授 (20126064)
|
Keywords | ハイパーテキスト / KWIC / 日本語 / 文法 / UNIX / テキストデータベース / Linux |
Research Abstract |
本年度は最終年度にあたり、これまで収集したテキストデータベースを用いて、XMLを用いた文法記述書の一部を作成した。また、そのためのXML記述の妥当性についてさまざまな検証を行った。XML化した文法書記述にあたっては、なるべくDTDは簡易な形として、固定化したものとはならないように留意した。ただし、TeXなどに印刷することを考え、論理的構造の部分については、確実な記述が行えることを目指した。 またXML化した文法データコーパスを処理するためのソフトウェアの開発およびデータ構造の確定についても従来のさまざまな研究を参考にしつつ、最適なものを策定した。報告書には、従来のコーパスに用いられたさまざまなマークアップの技法についての解説および現時点で考えられる最適なマークアップの方法についての議論を掲載した。 コーパスのもととなるさまざまな資料については、KWIC索引およびn-gram処理による文字列解析という新手法により、従来とは異なった観点から解析することが可能になった。これにより、付属語が自立語になるいわゆる文法化現象について、新しい観点からの立論が可能になり、文法研究にも有益であることが実証された。この成果については、別途著作を予定している。 以上のように、XMLによるハイパーテキスト文法書の実用化の基礎研究としての本研究は所期の目的を達成することができた。
|