1990 Fiscal Year Annual Research Report
アジア・アフリカ諸言語の電子辞典の編成とその利用技術についての研究
Project/Area Number |
02451064
|
Research Institution | Tokyo University of Foreign Studies |
Principal Investigator |
岡田 英弘 東京外国語大学, アジア・アフリカ言語文化研究所, 教授 (00014457)
|
Co-Investigator(Kenkyū-buntansha) |
西尾 哲夫 東京外国語大学アジア, アフリカ言語文化研究所, 助手 (90221473)
内藤 雅雄 東京外国語大学アジア, アフリカ言語文化研究所, 助教授 (00014506)
宮崎 恒二 東京外国語大学アジア, アフリカ言語文化研究所, 助教授 (40174156)
松村 一登 東京外国語大学アジア, アフリカ言語文化研究所, 助教授 (40165866)
梅田 博之 東京外国語大学アジア, アフリカ言語文化研究所, 教授 (20014459)
|
Keywords | 電子辞典 / アジア・アフリカの言語 / OCR / モンゴル文字 / アラビア文字 |
Research Abstract |
当研究の初年度である平成二年度には、辞書デ-タのコンピュ-タ-入力作業、及びその校正作業に全力を注ぎました。デ-タ入力には、ラテン文字系ではOCR(光学文字読取装置)を使用しましたが、その正読率が90〜95%程度と悪く、自動化とはほど遠い状態でした。これはOCR装置がソフトウェアを含めて、英語読取り用にチェ-ンされているためですが、これをアジア・アフリカの言語向けに改変するのは、当研究の手に余るものでした。結果、OCRデ-タは、エディタ-画面上での校正という原始的な手段に頼らざるをえませんでしたが、これは将来も大きなボトルネックとなります。他機関とも連絡を取って、根本的な対策を探求しなければならない問題です。 非ラテン系の文字の入力は、デ-タ入力の専門会社に外注しましたが納期と正確さの面から、この方法が最も望ましいものと思われます。ただ、入力会社でも手当のつかない文字(シリア文字、シンハラ文字など)は、パ-トタイムの学生に依頼しましたが、作業は大巾に遅れています。 同時に、既存の辞書検索・表示プログラムを改変して、当研究の目的に合致させるための作業が進みました。評価用のソフトウェアが完成し、ラテン文字系の特殊文字を用いた電子辞典が稼動しています。なお、この作業は、アジア・アフリカ言語文化研究所の松下周二所員が中心になって行われましたが、松下所員は海外学術調査のため3ケ月以上出張したので、当研究の分担者リストには掲載されていません。
|