研究概要 |
多変量アプローチによるディケンズの文体変化の分析 コーパスに組み込んだ情報標識を手掛かりにして,語彙項目の出現頻度データを編集し,各テキストの語彙頻度プロファイルを作成した。データに多変量解析による文体分析モデルを適用することにより,さまざまな語彙項目間の相互関係,テキスト間の相互関係,そして語彙項目とテキストとの相互関係を多次元空間に投影・視覚化する実験を繰り返し、解析方法の比較考察を行った。特に,対応分析と主成分分析の結果を比較し,計算法の違いがどのように結果に反映されているか吟味すると共に,変数に高頻度を使用した場合と低頻度語を使用した場合の解析結果を詳細に比較検討しテキストの文体分析に最適な手法の精密化を図った。 多変量アプローチから得られた分析結果のうち興味深い点は,ディケンズの文体の経年変化がほぼあらゆる項目に反映していることである。ディケンズの文体は初期(1830年代)から中期(1840年代)にかけて大きく変化し,1850年前後に安定期に入るというパターンが,高頻度語,低頻度語,文法範疇など,分析に使用したあらゆる変数にも投影されていた。こうした研究成果の一部を,2007年6月に米国で開催された国際会議Digital Humanities 2008や日本で開催された国際文体論学会PALA 2007,および統計数理研究所において開催されたセミナー「英語研究と統計2007」において発表した。
|