2002 Fiscal Year Annual Research Report
多変量解析を用いたジャンル・スタイル分析の方法論の比較研究
Project/Area Number |
13610579
|
Research Institution | The University of Tokushima |
Principal Investigator |
中村 純作 徳島大学, 総合科学部, 教授 (20035695)
|
Co-Investigator(Kenkyū-buntansha) |
田畑 智司 大阪大学, 言語文化部, 助教授 (10249873)
|
Keywords | コーパス / 分割表の数量化 / コレスポンデンス分析 / 主成分分析 / BNC World Edition / Dickens / 様態副詞 / スタイル |
Research Abstract |
中村を中心としたグループの先行研究では、BNC Samplerと呼ばれる現代イギリス英語200万語のコーパスから頻度副詞、程度副詞、様態副詞の14のジャンルにおける頻度を算出し、分割表の数量化を利用した結果、様態副詞が他の副詞類と違った振る舞いを示すことが判明した。そこで、昨年度、中村は1億語のコーパスであるBNC World Editionの14の領域における全ての"-ly"副詞を抽出し、その中から、頻度の高い典型だと考えられる163の様態副詞を抽出、主成分分析と分割表の数量化により得られる領域間の関係様態副詞相互の関係領域と様態副詞との相互関係を比較した。その結果、主成分分析を使用した場合、領域間の関係は列系列の分析で比較的妥当な結果が得られるものの、行系列ではほとんど軸の解釈が不可能な布置を示した。様態副詞相互の関連については列系列の分析でも、一般的に副詞間の分離の度合いが低いにも拘わらず、中には非常に他とかけ離れた高い値が与えられるものが見られるなど、問題が見られた。一方、分割表の数量化による結果では、領域の分布と副詞の分布に直接対応関係が見られ、各々の分布を説明する要素として物語調対論説調、くだけた調子対格式ばった調子のスタイルに関する要素が抽出され、おおむね妥当な結果が得られた。この結果は、今年度5月にスエーデンで開催されたICAME2002において発表された。 田畑は、昨年度に引き続き、これまで自分で編纂してきたDickensの作品コーパスを使用し、作品毎の品詞の分布を対応分析、上位30から60語の頻出単語の分布を主成分分析、様態副詞、(語尾が"-ly"のもの)の振る舞いについては対応分析を用いて分析した。品詞の分析では作品群がテキスト範疇(小説とスケッチ)で分類されるほか、年代別にも分類された。また、頻出語による分析では、登場人物の社会言語学的な変数とテキストの形式性が重要な要素として抽出された。本研究の主要なトピックである様態副詞による分析では、年代および小説対スケッチのテキスト範疇が主要な要素として抽出された。最終的に、この様態副詞のテキスト別頻度表と頻出語60語に対し主成分分析、対応分析をあてはめその結果を比較した。その結果、主成分分析の列系列分析では単語の分離の度合いが低いこと、行系列では頻度数の高い項目に過大な評価が与えられることと、頻度数を基準化する方が良い結果を得られること、対応分析の方がどちらかというと良い結果がえられることなどが判明した。
|
Research Products
(1 results)
-
[Publications] Junsaku Nakamora, Tomoji Tabata: "The Structure of the BNC World Edition Based upon the Distribution of -ly Manner Adverbs : cross-Examination by Means of Principal Component Analysis and Quantification of Contingency Table"ICAME2002, 22-26 May, 2002, Goteborg, Sweden.