統計学における多変量解析の手法を言語学および文体分析に応用する試みの一環として行った万葉集およびシェークスピア作品の分析において、いわゆる人麻呂作歌群と人麻呂歌集出典群の間には大きな距離があり「略体歌・非略体歌・作歌」の順に人麻呂自身の連続的発展がみられるという定説化した見解には疑問があることを指摘、またシェークスピア初期作品と一般にみなされている『ヘンリー六世』の第三部(および第二部)はむしろマーロー作品とみなすべきことを論証し、懸案の二つの帰属問題に新しい知見を示した。これらの分析ではカイ二乗検定、ホテリングのT^2検定、クラスター分析系、主成分分析、判別関数分析などの手法を用いている。 語彙分析と関連する分野として言語年代学における基礎語彙と偶然の一致の問題があるが、これについては2項分布モデルに基づく確率論的検討および相似性係数の有意性検定を試み応用可能性をさぐる一方、ニューズ記事をテキスト資料として、ドイツ語の文章の長さと倒置や名詞などの比率の関係をさぐる重回帰分析を行い、文体分析への応用可能性を検証。またゲーテの文体特徴をとらえる試みとして、『ウェルテル』『親和力』とニコライ『ゼバルドゥス』などの不変化詞頻度に基づく主成分分析を行って判別に有効な語彙と方法をさぐった上で、『ゲーテ・シラー往復書簡』を資料として文章長に関して分散分析、単語長に関してカイ二乗一様性を行い、1797年後半のゲーテの書簡は文章の長さが異様に長いことを推測統計学的に確定し、おそらくその原因は私生活におけるゲーテの一大決心と転機に求められることを指摘した。
|