交付申請書に記載した本年度実施計画通り、アダン・タヌリ版『デカルト著作集』第7巻および第8巻のコンピュータ入力を完了した。入力された原データは、現在磁気テープおよびフロッピーディスクの形で保有されている。ただし、下記の理由で、実質的な作業の開始が12月末まで遅れたため、原データを公開利用が可能な形にまで加工する作業は完了していない。今後、数ヶ月を要すると思われるが、現在村上勝三(山口大学人文学部)、佐々木周(北海道教育大学旭川分校)両氏の協力をえて、精力的な作業をすすめている。 当初はOCR(光学的文字自動読取装置)利用によるテクスト入力を計画し、業者と繰返し折衝するとともに、NTTの開発したOCRを複合通信研究所(横須賀)へ見学に行き、開発担当者から直接教示をえた。その結果、OCRによって読み取り可能なテクストは、OCRに内蔵された文字認識辞書の字形に合致した活字で印刷されたテクストのみであること、また漢字仮名混り文の読み取り用に開発された現在の国産OCRには、文字によって字間の異なるアルファベットを読みとらせるには若干の技術的困難があることが判明した。そこで今回は時間的制約のために、キーパンチャーによる入力を行うことにした。しかし、このような困難は、現在の技術レヴェルからして十分に克服可能であり、また同じ字形の活字で印刷された大量のテクストを入力するには、OCRの利用が時間的にも費用的にもはるかに好都合であるので、次年度はOCRによる入力を実現したいと考えている。 なお、本年1月10日東大大型計算機センターにおいて、第2回哲学者のためのデータ・ベース研究会を同研究会(代表加藤尚武、千葉大学文学部)と共催し、テクスト・データ・ベースの作成およびコンピュータ利用による哲学研究に関する研究交流を行った。
|