平成15年度は、日本語-カンボジア語辞書の試作版についてデータベースと構造の再検討と改良を行った。また既存の日本語電子化辞書を収集し、本辞書の検索補正システムの構築に利用可能であるかどうか検討した。 試作版辞書のデータベースと構造の改良のために、カンボジア語表示部分の見直しと語彙の追加の2つの作業を行った。カンボジア語表示部分の見直しに関しては、カンボジア文字は、幅や高さ、表示位置に特徴があり、言語資料を電子化するには入出力で非常な困難を強いられるが、電子化にあたって必要な入力システム、フォント、文字表示のソフトウェアも、オンライン辞書としての使用に耐えるものがまだ開発されていない。そのため本システムではカンボジア文字を画像で表示する方法を採用し、日本語の部分はテキストとして、html形式で表示することにより一般的なウェブブラウザから両言語の自然な併記を目指している。しかし、現在の試作版はオンライン辞書として使用するには構造が単純で、カンボジア語表記の部分が二次利用しにくいこと、また使用頻度の高い語ほどデータが重複し、語彙の追加の際に作業もサーバ側資源も有効活用できないという問題がある。辞書自体の構造を見直した上で画像データの表示方法も変更する必要があるため、カンボジア文字の特徴、辞書ユーザの利便性、サーバ資源の有効活用を考慮し、日本語とカンボジア語の併記に適したソフトウェアを検討した。 語彙の追加作業に関しては、新たに作成した画像編集プログラム、画像管理プログラムを利用し、カンボジア文字部分のデータ量を押さえるため、語単位で切り分け余白を省いたgif形式の画像にし、日本語との併記を考慮して高さ調節を行った後、データ重複を防ぐ管理を行った。 また、検索補正に必要な日本語見出しの整備のために、既作成のデータと日本語基礎語彙の重複の度合いを調べ、見出し語数を増加させる方法を検討した。
|