研究課題/領域番号 |
11871071
|
研究機関 | 京都大学 |
研究代表者 |
|
研究分担者 |
冨田 博之 京都大学, 総合人間学部, 教授 (70025477)
青山 秀明 京都大学, 総合人間学部, 教授 (40202501)
|
キーワード | 英語 / 単語長 / 統計解析 / 散文 / 韻文 |
研究概要 |
本研究では200万単語におよぶ独自の単語長データの統計的解析を通じて、英語文の構造の解明を主目的とするものである。今年度は、散文データの解析の第一段階が終了し、単語区切りの分布がランダムである、という我々の主張を確定することができた。またさらに辞書の単語長分布関数について、上のランダム性を用いたある仮説を提出した。これが論文1である。また、韻文については、単語区切りの相関関数の計算から、従来定まらなかった、散文・韻文の数学的区別・定義にある答えを出せた。これは論文2として出版した。 また、この相関関数を使う理論を適用して、T.S.Elliotの"Four Qualtets"における、いわゆる「4音節問題」に解答を出すことができた。実際には、その問題となる第1章について単語区切りの相関関数を計算し、第4音節においてするどいピークを持つことを発見した。このピークは他の章にはみられないものであり、実際に4音節区切りが存在することが数学的に証明されたと言える。 現在進行中の研究としては、数十万語程度の散文(小説)について、その単語長分布のさらに詳細な検討を行なっている。これには、ランダム・ウォーク(ウィーナー・ブラウン運動)としての乱数性の検証、多体相関関数の計算などを含む。この研究を通じて、現在までに我々は、一散文(小説)内を通して平均単語長がわずかに減少していく性質があることを発見した。これは我々が検討した10編程度の長編の散文についてほぼ共通に見られるた。これは従来までに全く知られていなかった性質である。現在、この研究を鋭意進め、論文をまとめるべく作業中である。
|