1991 Fiscal Year Annual Research Report
19世紀と20世紀初期のフランス体育書の文字列デ-タ化による体系的文献解題法研究
Project/Area Number |
03680114
|
Research Institution | Kobe University |
Principal Investigator |
清水 重勇 神戸大学, 教育学部, 教授 (60036671)
|
Keywords | フランス体育書 / 文献解題法 / 校正確度 / 異語 / 語彙頻度 / 誤入力 / 誤ワ-ド |
Research Abstract |
1.本年度の経過と成果 本年度購入した富士通製FMタウンズとNEC製PCー9801VxIIを併用しながら、予備実験として、被験者2名フランス語キ-ボ-ド入力作業によってサンプルデ-タを作成し、その校正実験を行った。異語リストならび新彙頻度リストを出力し、その悉皆的検査における誤入力のケ-スのデ-タ化を実施し誤ワ-ドのデ-タファイルを作成した結果つぎの事実が判明した。 (1)キ-ボ-ド入力作業で生じる誤入力ワ-ドの頻度はテキストの鮮明度に影響されることが多い。(2)修正実験での校正確度は習熟の度合いに関係なく約3%の残留誤ワ-ドとなった。(3)誤ワ-ドのリストでは頻度2以上の誤ワ-ドに若干の特徴が認められたが個人別の誤入力パタ-ンを特定できるほど有意な結果ではなかった。(4)誤ワ-ドを自動登録する校正専用プログラムを開発したが小規模デ-タでは上記のように有効に作動するが今後の大規模デ-タへの応用のためにはプログラムに改良を加える必要がある。 2.システム関係での成果 フランス語の特殊文記号のデ-タ変換作業過程は従来、外注によって行っていたが、FMタウンズの導入によってデ-タ作成・修正作業ラインの中に組み入れることができ、作業の能率化に役立っている。 異語リストならびに語彙頻度リストの作成にはテキストデ-タ-ベ-ス作成・運用システム「TEXAS」(弘前大学清水明氏開発Ver.2.58)を新たに導入することによって、処理速度が飛躍的に向上した。但し本研究のNEC製PCー9801VxIIの設定環境上で、TEXASは大型デ-タの処理にメモリ-限度があるため分割処理の必要がある。
|