2010 Fiscal Year Annual Research Report
多変量文体分析モデルによる近代英語散文の通時的コロケーション研究
Project/Area Number |
20520439
|
Research Institution | Osaka University |
Principal Investigator |
田畑 智司 大阪大学, 大学院・言語文化研究科, 准教授 (10249873)
|
Keywords | コロケーション / スタイル / 統計 / 多変量解析 / コーパス / ディケンズ / 文体論 |
Research Abstract |
本研究では,多変量文体分析モデルを近代英語散文のコロケーション分析に応用することにより,通時的視点から近代英語散文におけるコロケーションのパターンを記述するために以下のような仕事を遂行した。 (1) コーパスの整備および分析ツールの開発,最適化 まず,コーパスへの情報付与法の最適化実験を行った。コーパスのXMLによってマークアップし,最新のテクスト・インコーディング規格(TEI)に準拠した形式に変換した。さらに,コーパスからコロケーション・データを抽出,多変量解析を実行し,分析結果を自動的にグラフ表示可能にする一連の分析ツールの開発を行った。 (2) 多変量アプローチによるコロケーション分析の展開 コーパスの下位区分(サブコーパス)ごとのデータ編集を行い,各作家・ジャンル・時代区分毎に,対象とする中核語(nodes)と共起語(collocates)の出現頻度データを整理した。データ分析に主成分分析,対応分析等の分析アルゴリズムを適用することにより,共起語間の複雑な関係,テクストの相互関係,そして中核語・共起語とテクストとの相互関係を多次元空間に投影し,視覚化する。解析結果を通時的視点・共時的視点(使用域間変異)の両面から捉え文体論的考察を展開した。その結果,Dickens,18世紀サブコーパス,19世紀サブコーパスをそれぞれ特徴付けるコロケーションのパターンを類型化することができた。多変量アプローチによって得られた結果を足掛かりに,コンコーダンスラインの質的な読みを組み合わせた文体分析をおこない,Dickensのテクストにおいて,いかにコロケーションが文体意匠として機能しているかを論じた。研究成果の一部はDigital Humanities 2010 (London), PALA 2010 (Genoa)などの国際会議で発表し,高い評価を得た。
|
Research Products
(6 results)