2001 Fiscal Year Annual Research Report
多変量解析を用いたジャンル・スタイル分析の方法論の比較研究
Project/Area Number |
13610579
|
Research Institution | The University of Tokushima |
Principal Investigator |
中村 純作 徳島大学, 総合科学部, 教授 (20035695)
|
Co-Investigator(Kenkyū-buntansha) |
田畑 智司 大阪大学, 言語文化部, 助教授 (10249873)
|
Keywords | コーパス / 分割表の数量化 / 主成分分析 / BNC World Edition / Dickens / 様態副詞 / スタイル / ジャンル |
Research Abstract |
統計手法を用いた文体やジャンルの研究では、語彙や文法範疇のジャンルによる頻度を対象に多変量解析の手法を用いてその特徴を探るのが一般的であるが、本研究においては研究代表者の中村が分割表の数量化、研究分担者の田畑が主成分分析を担当し、両者のスタイル・ジヤンル分析における結果の妥当性の比較分析を目的としている。 本年度前半は、BNC Samplerと呼ばれる現代イギリス英語200万語のコーパスを利用し、その頻度副詞、程度副詞、様態副詞の14のジャンルにおける頻度を算出し、分割表の数量化により様態副詞が他の副詞類と違った振る舞いを示すことが判明した。普通、ジャンルの分類に寄与する最大の要因は話し言葉、書き言葉の言語使用域が上げられるが、様態副詞の場合には、創作散文と他のジャンルとの対比が一番際立ち、物語調か論説調かのスタイルが決定的な要因であることが分った。そこで、中村は最近リリースされたBNC Samplerの元であるイギリス現代英語1億語を網羅したコーパスであるBNC World Editionを、田畑はこれまで自分で編纂してきたDickensの作品コーパスを使用し、様態副詞(語尾が"-ly"のもの)の振る舞いを2つの多変量解析の方法で分析することにより、結果の妥当性を判断することにした。 現在、中村はBNC World Editionの14のジャンルにおける全ての"-ly"副詞の抽出を終わり、その中から、様態副詞を選び出す作業にあたっているが、文脈により様態副詞として用いられたり、程度副詞として用いられるケースが多く、その扱いと使用頻度の極めて少ない様態副詞の扱いを検討中である。田畑は、Dickensの作品に現れる様態副詞の抽出と頻度表の作成にあたっている。膨大な量のテキストを対象としているため作業の進行が遅れているが、頻度表が作成されれば、後は中村が分割表の数量化、田畑が主成分分析を用いて分析を行うが、これらは確立した統計手法であるため、比較的短時間で結論を得られるものと思われる。 なお、本研究の成果は2002年5月22日から26日にかけてスエーデンのGoteborgで開催されるICAME (International Computer Archive of Modern and Medieval English)の大会で発表するべく応募中である。
|
Research Products
(1 results)
-
[Publications] Junsaku Nakamura, Tomoji Tabata: "The Structure of the BNC World Edition Based upon the Distribution of -ly Manner Adverbs : Cross Examination by Means of Principal Component Analysis and Quantification of Contingency Table"ICAME 2002 22-26 May, 2002 Goteborg, Sweden.