2005 Fiscal Year Annual Research Report
日本古典籍画像データとテキストデータの連携及びそれを利用した文献学的研究
Project/Area Number |
16520288
|
Research Institution | Chuo University |
Principal Investigator |
山口 明穂 中央大学, 文学部, 教授 (70054195)
|
Co-Investigator(Kenkyū-buntansha) |
長崎 健 中央大学, 文学部, 教授 (20055164)
久保田 篤 成蹊大学, 文学部, 教授 (60178043)
矢田 勉 神戸大学, 文学部, 助教授 (20262058)
|
Keywords | 画像データ / テキストデータ / 平家物語 / 検索 |
Research Abstract |
本年度は、以下の作業を行った。前年度完成した、東京大学国語研究室所蔵・高野本『平家物語』の、東京大学多国語処理研究会の開発によるGTフォントを用いたテキストデータのチェックを行い、漢字字体まで原本に忠実な電子テキストの完成を得た。また、テキストデータと画像データとの連携について、システムの仮構築を行った。現在は、テキストデータによって検索を行い、当該ページのテキストデータとカラー画像、モノクロ画像(いずれもpdf化したもの)の三者を、ブラウザ上で容易に切り替える事の出来るシステムが試験的に利用できる段階になっている。システムの完成と公開の取り組みは、本研究計画終了後も、東京大学多国語処理研究会と協力しつつ継続して行っていく予定である。 現在、そのシステムの完全な運用を目指す上で、最大の問題となっているのはテキストの検索に関わる問題である。現在はGTフォントを用いて、字体まで指定した上でないと検索が出来ないが、字体差を捨象した検索やあいまい検索が可能になるよう、索引の整備を行いつつある。具体的には、テキストをJIS規格フォントに一旦作り直し、語の切れ目を挿入していく作業が現在進行中である。 また、周辺的な作業も幾つか行った。一には、同様のデータベースをより広げていくために、関連資料として『平家物語』の異本である『源平盛衰記』の一写本の撮影を行ったことである。二には、データベースの構築過程で気付かれた文献学的問題を元にした論考の発表である。具体的には山口明穂が語法史面について「『平家物語』の近代語的性格」(『築島裕博士傘寿記念国語学論集』2005年10月)を、書記史面について矢田勉が高野本『平家物語』の振り仮名一覧作成(成果の一部は報告書に掲載)を、それぞれ行った。
|
Research Products
(6 results)