研究概要 |
本研究では17〜20世紀初頭にかけての大規模近代英語散文コーパスを構築し,欽定訳聖書以降の近代英語散文の文体的特徴を通時的視座および共時的視座の両面から記述しようと試みるものである。申請者のこれまでの研究で実績を挙げてきた文体統計学的手法を利用することによって,英語散文の文体における口語脈の発達や言語使用域における文体変異の相を説得力の高い客観的な形で提示することを目指している。本研究はまた、量的な観点から近代英語散文の文体の特質を明らかにし,近代英語散文の英語史上の位置づけ,体系化を行おうとするものであり,従来定説と見なされてきた知見を再検討する一方,コンピュータを利用して初めて可能となるような方法論を取り入れることで,Chambers, Gordonらによる先行研究を補完し近代英語散文の文体研究に新しい方向付けを行おうという試みである。本研究計画初年度である本年度(平成14年度)は,研究基盤を確立するために,以下の仕事を遂行した: (1)テキストに品詞標識・構文標識の組み込み法に関する基礎的研究を行った。 (2)自動品詞タグ付けプログラムを実行し電子テキストに第一次品詞標識付与作業を行った。 (3)これまでは平テキストに対してLILAC方式およびSIL Standard Reference(SIL Format)を用いてきたが,詳細な文書情報,語彙品詞標識情報を記述する上で,SGMLやXMLなどのマークアップ言語の利用に向けた実験を開始した。 (4)マークアップ法の参考としてBritish National Corpusにおけるタグ付けを調査し,検索プログラムBNCwebを用いてその有効性の検証を開始した。
|