研究概要 |
本年度は、超大規模データ処理についての具体的方法を実行し、それによって特定の問題を考察することを試みた。手順は次のようである。 1 UNIXワークステーション上でデータ処理を行い、必要な単語をKWIC形式でまとめた。単語を含むコーパスとしては、市販されている新聞データを主に用いた。システムの一部に付いてはWWWで公開している。(URL http://klab.ri.aoyama.ac.jp/) 2 必要な単語についてのKWIC索引をもとに、文法情報についてのデータベース(ハイパーテキストの形式で作成)を構築し、それを参照しながら、構文研究を行った。データベースは、単語とその属性とが記述されており,当該属性に関する他の単語についても容易に検索することが出来るようになっている。このシステムはWWW上に構築されており、ローカルの利用も、ネットワーク上の利用も同様にできるようになっている。 3 以上の処理システムの上で、現代日本語の名詞節の構造および副助詞の構造についての考察を行い、研究成果として発表した。 以上のように研究成果を得たことから、今回のシステムの有効性を確認できた。次年度は更にこのシステムの充実を図りたい。
|