研究概要 |
ディジタル言語学資料の再生利用に関する研究 1 平成10年度、昨年度に引続き、国立国語研究所で記録、保管されている電子化されている言語学データを再生する実験を実施した。 昨年度は、パーソナルコンピュータ関連の過去の蓄積データ(8インチフロッピィ、5インチフロッピィ、3.5インチフロッピィ、レガシーハードディスク)をUNIXワークステーションに転送する実験を実施した。今年度は、汎用機上のオープンリールテープ上のデータを転送する実験を行った。 2 発掘と保全 汎用機で動作するオープンリールテープ(およそ20年前に記録されたもの)、保全する必要のある120巻を選択した。 (1) 物理的なチェック:1巻ごとにテープの状態をチェックした。シリコングリースが融け、磁気テープ部分に付着し、そのためテープ装置に物理的にマウントできないテープがあった。また、ケースが破損したものがあり、約10巻がこのステップで再生不能である。 (2) マウント試験:磁気テープ装置にテープを装填し、マウント試験を行った。その結果、および50巻がマウントに失敗した。標準記録形式でないフォーマットで記録されたものである。さらにフォーマット形式を記録したデータが散逸していることも調査で判明した。 (3) データ転送:約半分の60巻について汎用機上から、UNIXワークステーションにデータ転送を行った。UNIX上でコード変更を実施して、SJIS(EUC,JIS)データに変更した。3維持と管理汎用機上のデータは、管理者によって集中管理されているために、データが物理的に消滅することはほとんどないが、(1)経年によるテープの化学変化や物理破損によってデータ消滅と同じ状態になっている、(2)汎用機上での特有のコードを使って記録しているために、コード変換が必要である、(3)標準的なデータフォーマットになっていない記録形式は、フォーマット記録がないとデータ消滅状態と同様であることが分かった。 昨年度のパーソナルコンピュータ上でのデータ発掘と今年度の汎用機上でのデータ発掘調査によって、データの再利用方法について初期段階の方法論が確立した。今後は、調査範囲を広げ、消滅の危機にあるデータの保全と維持してゆく必要がある。
|