• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

タルコットパ-ソンズ著作論文のテキスト・デ-タべ-ス化に関する研究

Research Project

Project/Area Number 01510095
Research Category

Grant-in-Aid for General Scientific Research (C)

Allocation TypeSingle-year Grants
Research InstitutionHokkaido University of Education

Principal Investigator

宇田川 拓雄  北海道教育大学, 教育学部函館分校, 助教授 (30142764)

Project Period (FY) 1989
Project Status Completed (Fiscal Year 1989)
Keywords社会学 / テキスト・デ-タベ-ス / コンピュ-タ / OCR / マッキントッシュ / スキャナ- / パ-ソンズ / BASIC言語
Research Abstract

(1)高速演算可能な米国アップル社のマッキントッシュSE/30を導入した。
(2)現有のPC/XTからマッキントッシュへ、ダイレクト・ケ-ブルと通信ソフトを用いてデ-タを移動させた。
(3)検索用プログラムはBASIC言語で自作したものをPC/XTからマッキントッシュへ移植した。
(4)従来テキスト入力はキ-ボ-ドで行っていたが、スキャナ-とOCR(光学式文字認識)リフトによる入力を試みた。
(5)スキャナ-は共同利用施設のものを用い、OCRリフトは米国カエレ社のオムニ・ペ-ジを購入した。
文字認識の実験結果は次のとおりである。
(1)書物からの入力の場合、認識率はほぼ100%であった。ただしこれは、ソフトが認識できないと判断したものがほとんどなかったということで、詳しく調べると誤識別は約0.2%発生していた。
(2)学術雑誌論文のコピ-からの場合、認識率は98%程度であった。これは文字単位なので単語単位で見ると9.7〜6.7%のエラ-がある。実際には1単語に複数のエラ-のある例が多く、最終的には95%程度の単語認識率であった。
(3)OCR認識には大量のメモリ-を必要とする。現在の4MBでは不足気味である。レタ-サイズ1ペ-ジは1度に処理するのはむずかしい。
(4)スキャナ-での取込と、認識後のエラ-の修正に時間がかかる。従ってパソコン本体だけでなくスキャナ-も専用機が望ましい。
(5)エラ-の修正にはスブルチェッカ-が有効である。また原稿はできるだけきれいなものでなければならない。
(6)OCRによるテキスト・デ-タベ-スの構築は将来的に有望である。

Report

(1 results)
  • 1989 Annual Research Report
  • Research Products

    (1 results)

All Other

All Publications (1 results)

  • [Publications] 宇田川拓雄: "タルコットパ-ソンズ・デ-タベ-スの作製の試み" 北海道教育大学紀要. 40. (1990)

    • Related Report
      1989 Annual Research Report

URL: 

Published: 1993-03-26   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi