研究概要 |
本年度は,まず,これまでの検討結果を基に少人数での辞書編纂の1つの手順をとりまとめ,その手順での作業を補助するための各種のユーティリティ・プログラムからなる辞書編纂支援システムを開発し,実際にブルガリア語・日本語辞書の編纂を開始した。 辞書編纂のために収集した印刷形式でのデータは,当初はキーボードから入力することを想定していたが,実際に作業を開始するのとほぼ同時に,アクセント付きのスラブ文字に対してもOCRソフトウエアが十分利用できることが判明したので,そのOCRソフトウエアを利用することにした。ただし,OCRソフトウエアでの文字コードと,我々のシステムでの文字コードが異なるため,コード変換のユーティリティも必要が必要となり開発した。また,かなり高性能ではあるが,OCRソフトの読み間違いもあるために,可能な限りではあるが,OCRでの読みとり結果のチェックを行うユーティリティも作成した。 なお,年度途中の1999年10月から1年間の予定で,担当者の1人が1年間ブルガリアで研究することになり,現地でブルガリアの研究者の協力を得て,ブルガリア語の単語のチェックなどの辞書編纂のためのより詳細な情報を得ることが可能になった。そして,単語の分綴および発音記号の生成のユーティリティは昨年度に作成していたが,ブルガリアでの情報収集の結果,分綴・発音について,品詞の情報を入れた方が,より正確な処理が出来ることが分かったため,再度作り直した。 実際に編纂作業を開始するにつれ,より詳細な情報の必要が生じたり,さらなる問題が生じる場合もあり,結果的には,編纂作業を進めながら,さらにその経験をフィードバックして,手順とユーティリティ・プログラムの変更・改善を行うという方法で,手順の確立とユーティリティ・プログラムの集合体としてのシステムを一応完成させた。また,約2300語程度の見出し語のブルガリア語・日本語辞書の第1版の編纂もほぼ終了した。ただし,ブルガリアで作業をしていた辞書編纂の担当者のパソコンの異常により,予定していた辞書編纂の完成は若干遅れることとなった。
|