研究課題/領域番号 |
09710368
|
研究種目 |
奨励研究(A)
|
配分区分 | 補助金 |
研究分野 |
言語学・音声学
|
研究機関 | 東京外国語大学 |
研究代表者 |
佐野 洋 東京外国語大学, 外国語学部, 助教授 (30282776)
|
研究期間 (年度) |
1997 – 1998
|
研究課題ステータス |
完了 (1998年度)
|
配分額 *注記 |
2,300千円 (直接経費: 2,300千円)
1998年度: 1,200千円 (直接経費: 1,200千円)
1997年度: 1,100千円 (直接経費: 1,100千円)
|
キーワード | 電子化データ / 電子考古学 / レガシープラットホーム / データベース / データマイニング / レガシ-プラットホーム |
研究概要 |
ディジタル言語学資料の再生利用に関する研究 1 平成10年度、昨年度に引続き、国立国語研究所で記録、保管されている電子化されている言語学データを再生する実験を実施した。 昨年度は、パーソナルコンピュータ関連の過去の蓄積データ(8インチフロッピィ、5インチフロッピィ、3.5インチフロッピィ、レガシーハードディスク)をUNIXワークステーションに転送する実験を実施した。今年度は、汎用機上のオープンリールテープ上のデータを転送する実験を行った。 2 発掘と保全 汎用機で動作するオープンリールテープ(およそ20年前に記録されたもの)、保全する必要のある120巻を選択した。 (1) 物理的なチェック:1巻ごとにテープの状態をチェックした。シリコングリースが融け、磁気テープ部分に付着し、そのためテープ装置に物理的にマウントできないテープがあった。また、ケースが破損したものがあり、約10巻がこのステップで再生不能である。 (2) マウント試験:磁気テープ装置にテープを装填し、マウント試験を行った。その結果、および50巻がマウントに失敗した。標準記録形式でないフォーマットで記録されたものである。さらにフォーマット形式を記録したデータが散逸していることも調査で判明した。 (3) データ転送:約半分の60巻について汎用機上から、UNIXワークステーションにデータ転送を行った。UNIX上でコード変更を実施して、SJIS(EUC,JIS)データに変更した。3維持と管理汎用機上のデータは、管理者によって集中管理されているために、データが物理的に消滅することはほとんどないが、(1)経年によるテープの化学変化や物理破損によってデータ消滅と同じ状態になっている、(2)汎用機上での特有のコードを使って記録しているために、コード変換が必要である、(3)標準的なデータフォーマットになっていない記録形式は、フォーマット記録がないとデータ消滅状態と同様であることが分かった。 昨年度のパーソナルコンピュータ上でのデータ発掘と今年度の汎用機上でのデータ発掘調査によって、データの再利用方法について初期段階の方法論が確立した。今後は、調査範囲を広げ、消滅の危機にあるデータの保全と維持してゆく必要がある。
|