研究課題/領域番号 |
14510494
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
中国語・中国文学
|
研究機関 | 慶應義塾大学 |
研究代表者 |
村越 貴代美 慶應義塾大学, 経済学部, 教授 (50239513)
|
研究分担者 |
種村 和史 慶應義塾大学, 商学部, 助教授 (90265926)
千田 大介 慶應義塾大学, 経済学部, 助教授 (70298107)
二階堂 善弘 関西大学, 文学部, 助教授 (70292258)
師 茂樹 花園大学, 文学部, 専任講師 (70351294)
|
研究期間 (年度) |
2002 – 2004
|
研究課題ステータス |
完了 (2004年度)
|
配分額 *注記 |
3,500千円 (直接経費: 3,500千円)
2004年度: 700千円 (直接経費: 700千円)
2003年度: 700千円 (直接経費: 700千円)
2002年度: 2,100千円 (直接経費: 2,100千円)
|
キーワード | 電子図書館 / 中国古典文献 / 段玉裁 / 彊村叢書 / Perl / XML / 正規表現 / テキストデータベース / 彊邨叢書 / 漢文 / 音韻処理 / 段玉載緯書 / 書同文 |
研究概要 |
本研究では、単純な用例検索にとどまらない、学術的ニーズに合致した次世代中国古典文献データベースの構築を見据えて、その基礎的研究を行った。 本研究申請時に掲げた目標のうち、(1)オンライン漢字・中国語辞書の構築については、『説文解字注』・『広韻』等の字書・韻書のデジタル化を完成させ、インターネットWWW上に公表した。(2)中国古典文献・漢文に適合したデータ形式の研究に関しては、詞の総集である『彊村叢書』、および段玉裁『詩経小学』・『詩経小学録』等をそれぞれ電子テキスト化するとともに、それぞれの文書の理論構造をXMLによってマークアップした。それによって、中国古典文献のさまざまな文体をXMLにより構造化するノウハウを蓄積した。後者については、同一作者の複数の著書を電子テキスト化し、その構造をXMLによってマークアップしたが、同形式が特定語彙の注釈を抽出して解釈のゆれを析出する上で非常に有用であることを確認した。なお、以上の文献についても、インターネットWWWを通じてデータを公開し、広く学会の便に供する予定である。(3)両者を連携させた検索システムの開発については、『説文解字』『広韻』等から抽出した漢字テーブルをもとに、スクリプト言語の一種であるPerlの機能を拡張し、韻律等に基づく文献正規表現処理の初期的な実験に成功した。これによって、文献を母音や子音のパターンによって統計的に分析する途が開けた。また、中国古典文献のWebを通じた流通に欠かせない、訓点文の表示についても、研究を進めツールを開発した。 以上から、次世代テキストデータベースの基礎の確立という本研究の目的は、十分に達せられたと言えよう。
|