1999 Fiscal Year Annual Research Report
パソコンの画像処理を応用した中世ポルトガル語叙情詩の本文校訂のための基礎研究
Project/Area Number |
10610532
|
Research Institution | Tokyo University of Foreign Studies |
Principal Investigator |
黒澤 直俊 東京外国語大学, 外国語学部, 助教授 (80195586)
|
Keywords | 中世ポルトガル語 / 叙情詩 / 本文校訂 / 文献学 / ガリシア・ポルトガル語 / カンティーガ / 写本 / テキスト・クリティック |
Research Abstract |
本年度は昨年度に引き続き画像データの入力を継続した.3写本に共通して現れる54篇に関しては20篇ほどの残りの入力が完了し,すでに162画像がひとつのコーパスを形成している.3写本のひとつであるアジュダ写本にはこの54篇のほかに266篇の詩篇が含まれているのでそのうちの160篇ほどをさらに画像入力した.過去に出版されたエディションのOCRを用いたテキスト・データ化については,印刷状態の関係もあり,OCRの読みこみ精度も上がらず充分な成果をあげることは出来なかった.エディションについては歴史的に重要なエディションで版権等の問題も生じないものを選び画像入力することにした.ディスプレイ上で対照させるにはそれで充分であるからである.機械的な作業は教務補佐員に行なわせた.画像の処理に関し,画面上で写本の検討を行う限りでは,読みこみの際に充分精度を上げておけば圧縮方式のJPEGでもかなりの効果が得られることがわかったので,データを使用して資料の転写などを行う際に活用することにした.この方式だと1画像あたり1Mb程度で済み,データの転用が容易である.これらのデータをデータベースソフトによって,1)写本内の位置,2)ジャンル,3)作者,4)作成推定年,5)詩形および韻律情報,6)写字生に関する情報および7)その他の専門技術的情報を付しリレーショナル化した. 以上,本年度の実施計画は十分に遂行された.すでに,データを中世語研究のために活用しているが,次年度以降,引き続き入力を継続するとともに,文学テキスト研究のための基礎データとして活用する予定である.なお,データの保存や活用の便を図るためCD化もひとつの選択肢として検討する必要があろう.
|