研究課題/領域番号 |
16520288
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
日本語学
|
研究機関 | 中央大学 |
研究代表者 |
山口 明穂 中央大学, 文学部, 教授 (70054195)
|
研究分担者 |
長崎 健 中央大学, 文学部, 教授 (20055164)
久保田 篤 成蹊大学, 文学部, 教授 (60178043)
矢田 勉 神戸大学, 文学部, 助教授 (20262058)
|
研究期間 (年度) |
2004 – 2005
|
研究課題ステータス |
完了 (2005年度)
|
配分額 *注記 |
3,400千円 (直接経費: 3,400千円)
2005年度: 1,100千円 (直接経費: 1,100千円)
2004年度: 2,300千円 (直接経費: 2,300千円)
|
キーワード | 画像データ / テキストデータ / 平家物語 / 検索 |
研究概要 |
本研究計画では、以下の作業を行った。まず、東京大学国語研究室所蔵・高野本『平家物語』を、高精度のデジタルカメラを使用して撮影し、画像データを収得した。また、フィルムカメラによる撮影も同時に行って、フィルムスキャナにかけることで、モノクロ画像データも作成した。次に、東京大学多国語処理研究会の開発によるGTフォントを用いたテキストデータ化の入力作業を行い、漢字字体まで原本に忠実な電子テキストの完成を得た。更に、テキストデータと画像データとの連携について、システムの仮構築を行った。現在は、テキストデータによって検索を行い、当該ページのテキストデータとカラー画像、モノクロ画像(いずれもpdf化したもの)の三者を、ブラウザ上で容易に切り替える事の出来るシステムが試験的に利用できる段階になっている。システムの完成と公開の取り組みは、本研究計画終了後も、東京大学多国語処理研究会と協力しつつ継続して行っていく予定である。 現在、そのシステムの完全な運用を目指す上で、最大の問題となっているのはテキストの検索に関わる問題である。現在はGTフォントを用いて、字体まで指定した上でないと検索が出来ないが、字体差を捨象した検索が可能になるよう、索引の整備を行いつつある。具体的には、テキストをJIS規格フォントに一旦作り直し、語の切れ目を挿入していく作業が進行中である。 また、周辺的な作業も幾つか行った。一には、同様のデータベースをより広げていくために、関連資料として『平家物語』の異本である『源平盛衰記』の一写本の撮影を行ったことである。二にはデータベースの構築過程で気付かれた文献学的問題を元にした研究である。具体的には山口明穂が語法史面について「『平家物語』の近代語的性格」(『築島裕博士傘寿記念国語学論集』2005年10月、報告書に掲載)を、書記史面について矢田勉が高野本『平家物語』の振り仮名一覧作成(一部は報告書に掲載)を、それぞれ行った。
|