研究概要 |
多言語シソーラスシステムの開発:データベースの国際的流通にともない使用されている用語が多種類にわたりまた問合せの際にも各種の表現が用いられるようになってきた。データーの記述および問合せにおいて正確さと効率向上のためには、標準化された用語の使用が望ましい。具体的には科学技術用データベースを対象として、主要言語として、日,英,独,仏,露,中,西,蘭8ケ国語を最終目的とした多言語シソーラスシステムの作成を行っている。本年度は特に日-英-独3ケ国語の科学技術用語に対するシソーラスの作成と、8言語シソーラスの試作を行なった。これらのシソーラスはいずれも、CD-ROMディスク上に記録され、パーソナルコンピュータで検索可能となっている。この結果大量辞書情報を容易に利用することが可能となり、多言語にわたるキーワード変換をコンパクトに実現でき、データベースの多言語アクセスを目標とするシステム開発に具体的な有効性を示しえたものと言える。 学術用語の解析:従来入力されていた学術用語集23分野に加え、鉱山冶金と学術用語集には含まれていない重要分野の一つである情報処理の2分野の追加、あよびJIS用語辞典から基本・一般編と電気編の計算機可読化を行い、より詳細な統計的解析を行った。これらの解析の結果、いずれの言語においても分野を限定することにより用語の多義性が著しく減少することが分かったので、シソーラスとしては分野別分類記号を付加したものを作成している。また、専問の分化とともに用語の構成語数が増加し、英語では2語以上のものが1語のものに対し70%で大部分を占めていることが分かった。従ってキーワード変換においては、1語のキーワードより2語以上のキーフレーズを効率よく変換するシステムが重要であるので現在その方向でのシステム開発を行なっている。
|