研究課題/領域番号 |
10111234
|
研究機関 | 福岡大学 |
研究代表者 |
白石 修二 福岡大学, 理学部, 助教授 (30171036)
|
研究分担者 |
柴田 勝征 福岡大学, 理学部, 教授 (50028213)
輪田 裕 福岡大学, 理学部, 教授 (00122763)
|
キーワード | ブレーズ・パスカル / テキストデータベース / 言語解析 / 頻度表 |
研究概要 |
1997年度来、パスカルのデータベース作成を行っている。メナール版パスカル全集を底本とし、既刊されている全4冊、第1巻から第4巻までをすでに電子テキスト化し、頻度表作成により、信頼性の高い、より精緻なデータベースを構築中である。第2巻のパスカル自身が書いた部分を抜粋しての電子テキストは、パスカル頻度表2-1の完成により、データベースとしての完成をみている。2-1は、第2巻でパスカルが書いた部分のみを抜粋した。頻度表は、まず2巻中の収録作ごとに分けて、アルファベット順、頻度順、逆引き順と作成し、また同時に、メナール版の特徴として、時系列的に作品を並べていることから全体を併せて一つの作品と考え、この頻度表も作成した。これについても同じようにアルファベット順、頻度順、逆引き順と作成した。この頻度表の作成は、誤入力の発見に貢献し、データベースをより完璧なものに近づけるものである。と同時に希少語の発見などにみられるように、1次的な資料としての役割も担うので、大いに意義のあることとして、細心の注意をはらって取り組んできたものである。このパスカルデータベースは、メナール版に忠実に電子テキスト化している。パスカル本人が書いた部分とそれ以外の部分(例えば引用、パスカル宛ての書簡、メナール自身の脚注)などが混在しているメナール版では、通常では、その頻度の現れ方に、パスカル自身の言葉ではない言葉も混入してくるのは避けられない。そこでパスカルの言葉のみを自動的に切り出せるように目印を入れ、パスカル自身の言葉にこだわり、細心の配慮をもって作成した。
|