研究概要 |
分析方法の精緻化:本計画で構築したコーパスを基に,語彙項目の出現頻度データを編集し,語彙頻度プロファイルを作成した。多変量解析による文体分析モデルを適用してデータ分析を行うことにより,さまざまな語彙項目間の相互関係,テキスト間の相互関係,そして語彙項目とテキストとの相互関係を多次元空間に投影・視覚化する実験を繰り返し、解析方法の比較考察を行った。特に,対応分析と主成分分析の結果を比較し,計算法の違いがどのように結果に反映されているか吟味すると共に,変数に高頻度を使用した場合と低頻度語を使用した場合の解析結果を詳細に比較検討しテキストの文体分析に最適な手法の精密化を図った。 ディケンズ研究への応用:多変量アプローチから得られた分析結果のうち興味深い点は,ディケンズの文体の経年変化がほぼあらゆる項目に反映していることである。ディケンズの文体は初期(1830年代)から中期(1840年代)にかけて大きく変化し,1850年前後に安定期に入るというパ・ターンが,高頻度語,低頻度語,文法範疇など,分析に使用したあらゆる変数にも投影されていた。こうした研究成果の一部を,計算機援用人文科学研究に関する国際会議ACH/ALLC,DigitalHumanitiesや国際文体論学会PALAの年次大会,および統計数理研究所において開催されたセミナー「言語研究と統計2008」において発表した。
|