研究概要 |
本研究は18〜19世紀の英語散文大規模コーパスを構築し,いわゆる「散文の世紀」と呼ばれる時代からvictoria時代にかけての英語散文の文体的特徴を通時的視座および共時的視座の両面から記述しようという試みである。計二年目の平成13年度は,前半では,平成12年度に引き続き言語データの電子化法の理論的検討と実験を相補的な形でとりおこなうことによって研究基盤の確立をはかり,後半では,出来上がった電子コーパスの統計学的解析を通して,英語散文文体における口語化の傾向や言語使用域における文体変異の相を分析した。研究成果の主な点は次の通りである: 1.語彙品詞標識マークアップ(組み込み)法の理論的検討および実践。最近のコーパス言語学の成果,とりわけマークアップに関する研究を比較検討し,文体研究に最適化した形でマークアップを応用する方法を研究した。電子テキストを元に,様々なタイプのテキストマークアップの試行とテキスト分析の実験を繰り返し,英語散文のテキスト処理に有用なマークアップ方法の開発を試みた。その結果,品詞標識に関してはPenn-Treebank方式に準じた形式を採用し,自動品詞標識付与プログラム(UNIXサーバ上で稼働)に学習させることで,自動認識率を96%以上にまで高めることが可能になった。本研究計画で作成したコーパスはいずれもPenn-Treebank準拠の品詞標識が埋め込まれている。なお,この成果の一部については,研究代表者が編集した論文集『電子化言語資料分析の方法論』(大阪大学言語文化部・大阪大学大学院言語文化研究科発行)所収の「英語文体論研究のための言語処理技術-Corpus Processing for Stylistic Analysis of Texts」に発表した。 2.コーパスデータの文体統計学的分析。編纂したコーパスから得られたデータを基に,さまざまな語彙項目や構文間の相互関係,テキスト間の相互関係,そして語彙や構文とテキストとの相互関係を分析し,Dickensの散文を軸にその前後の時代,すなわち,18世紀および19世紀後半の散文との文体比較を行った。その結果、18〜19世紀の英語散文における言語特徴の出現パターンは,経年的に変化しているということ,特に,19世紀初頭の散文において典型的に認められるより文語的,形式的,複雑な構造を持ったものから,19世紀後半の散文に特徴的な相対的に口語的,並列的,文脈依存な傾向を深めた文体へと移り変わっていることを本研究は明らかにした。なお、この成果の一部はオランダ・Rodopi社より本年3月発刊のEnglish Corpus Linguistics in Japanの第16章1nvestigating Stylistic Variation in Dickens through Correspondence Analysis of Word-Class Distribution,および渡辺秀樹(編)『英語文体論の方法と射程』(大阪大学言語文化部・大阪大学大学院言語文化研究科発行)の第4章「コーパス言語学の文体論:Corpus-Based Stylistics-MF/MD法による文体比較」にて発表した。
|