研究課題/領域番号 |
06451163
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
統計科学
|
研究機関 | 統計数理研究所 |
研究代表者 |
村上 征勝 統計数理研究所, 領域統計研究系, 教授 (00000216)
|
研究分担者 |
今西 祐一郎 九州大学, 文学部, 教授 (90046219)
|
研究期間 (年度) |
1994 – 1996
|
研究課題ステータス |
完了 (1996年度)
|
配分額 *注記 |
3,200千円 (直接経費: 3,200千円)
1996年度: 400千円 (直接経費: 400千円)
1995年度: 700千円 (直接経費: 700千円)
1994年度: 2,100千円 (直接経費: 2,100千円)
|
キーワード | 源氏物語 / 計量分析 / データベース / 語彙用例総索引 |
研究概要 |
池田亀鑑編『源氏物語大成』をテキストとし、すべての文章を単語分割し、品詞情報を付けた『源氏物語』54巻(約38万語)のデータベースを完成し、自立語約21万語、付属語約17万語に関して、それぞれ語彙用例総索引を出版した。また、紫式部日記に関しても、同様のデータベースを完成し、語彙用例総索引を出版した。 更に、『源氏物語』関連文献として、『山路の露』、『雲隠六帖』、『手枕』の文章を単語分割し、品詞情報を付けたデータベースも作成した。加えて、文章データを処理するための種々のプログラムを開発した。 また、これらのデータベースを用いて、『源氏物語』の各巻の文章を統計的に分析し、他作家説のある『源氏物語』の後半の10巻の文章が、品詞の使用率、言葉の使用率等の多くの点で前半の44巻と異なること、また会話文と他の文では、助動詞の用い方に明らかな差があることなど、新しい知見を得た。また、助詞の使用率の変化から、『源氏物語』の執筆開始時期の推定も試みた。
|