(1)高速演算可能な米国アップル社のマッキントッシュSE/30を導入した。 (2)現有のPC/XTからマッキントッシュへ、ダイレクト・ケ-ブルと通信ソフトを用いてデ-タを移動させた。 (3)検索用プログラムはBASIC言語で自作したものをPC/XTからマッキントッシュへ移植した。 (4)従来テキスト入力はキ-ボ-ドで行っていたが、スキャナ-とOCR(光学式文字認識)リフトによる入力を試みた。 (5)スキャナ-は共同利用施設のものを用い、OCRリフトは米国カエレ社のオムニ・ペ-ジを購入した。 文字認識の実験結果は次のとおりである。 (1)書物からの入力の場合、認識率はほぼ100%であった。ただしこれは、ソフトが認識できないと判断したものがほとんどなかったということで、詳しく調べると誤識別は約0.2%発生していた。 (2)学術雑誌論文のコピ-からの場合、認識率は98%程度であった。これは文字単位なので単語単位で見ると9.7〜6.7%のエラ-がある。実際には1単語に複数のエラ-のある例が多く、最終的には95%程度の単語認識率であった。 (3)OCR認識には大量のメモリ-を必要とする。現在の4MBでは不足気味である。レタ-サイズ1ペ-ジは1度に処理するのはむずかしい。 (4)スキャナ-での取込と、認識後のエラ-の修正に時間がかかる。従ってパソコン本体だけでなくスキャナ-も専用機が望ましい。 (5)エラ-の修正にはスブルチェッカ-が有効である。また原稿はできるだけきれいなものでなければならない。 (6)OCRによるテキスト・デ-タベ-スの構築は将来的に有望である。
|