研究分担者 |
塚本 啓祥 東北大学, 文学部, 教授 (30062772)
星野 聰 京都大学, 大型計算機センター, 教授 (90025867)
石田 晴久 東京大学, 大型計算機センター, 教授 (70017317)
久保内 端郎 東京大学, 教養学部, 助教授 (90017624)
樋口 忠治 九州大学, 教養部, 教授 (70039056)
|
研究概要 |
海外テキスト・データの開発状況については, 久保内, 沖田によって英米圏の状況が把握され, ドイツについては主要研究機関に手紙でとい合わせて状況を把握した. 海外から輸入できるデータが存在することを知らない研究者がおおいので, 特にこの件については, 本研究費によって刊行する「人文科学におけるテキスト・データベース白書」に沖田が寄稿した. 国内の状況は樋口, 星野, 塚本, 荻野によって西洋学・東洋学両面にわたる研究が進行すると同時に全国的な状況が把握された. 統一的なシステムの開発については, 当初の予想を超えて, 種々のコード形態を機械的に転換することによって, データベース専用のコード・システムを設定しないですむという方向に進んでいる. OCR(光学文字読み取り機)の利用は, 千葉大学に特別研究費によって, 1月25日にカーツワイル4000が納入された結果, 当初の予想を遥かに上回る成果をえた. 同機の利用形態として単にテキスト・データの作成だけではなく, 経済統計の入力, 新聞記事からの現代用語シソーラス作成, 外国語教材の検査・作成などにも大きな威力を発揮することが判明した. 事実上はほぼ連日ワークショプが開催されている状況となり, 哲学関係のテキストのデータ化が大量に進行した. それによっていままで不可能であったテキスト間の比較が可能になり, データベース作成の戦略的指針が得られる見込みがでてきた. 検索方法の研究も格段の進歩を見せ, 大型計算機によってOCP(オックスフォード・コンコーダンス・プログラム)を走らせ, パソコンでは手作りのいくつかの優れたソフトの普及をはかるという基本方針が浮かび上がってきている.
|