昨年度の研究と開発を通して得られた、各種の処理プログラムの改良と発展を推進すると共に、特にデータベース中の全英単語に対する、機械辞書を参照しながらの自動品詞標識(タグ)付与のためのプログラム、およびその結果ファイル中の、複数の候補タグが与えられた単語に対する最適タグへの絞り込みを実現するためのアルゴリズム、プログラムが一定の水準に達したと考えられる。 昨年度までに構築していた、イメージスキャナによる、印刷された英文からの自動文字読み取りに関しては、ソフトウェア側のドライバソースを書き換えることにより、直接的にスキャナとのデータ交信を行わずとも、予め別の画像取り込みソフトによって取得されたTIFF形式の画像データに対して、独自の支援プログラムを活用した文字認識を行わせることが可能になった。従って、対象の印刷物の性格に依存する場合あるが、従来とは比較にならないほどの高速で、かつ、正確な文字読み取りが実現されるにいたった。これによって、個々の英語研究者。英語教授者が、自らのニーズに即したデータをパーソナルコンピュータに取り入れるための強力な手段が完成したと言える。また、自動タグ付与処理と、その後の最適タグ選定処理に関しては、確率・統計的な手法によるアルゴリズムが、相当の成績を納め、これと並行して施される、英文法の規則に準拠したタグの絞り込み処理とを有機的に関連付けることにより、今後、一層精度の高い自動タグ付与システムが構築されることになろう。計算機が最も得意とする、確率・統計処理のような数値処理の手法と、一般化してプログラム上では実現しにくい側面を持つ文法規則に準拠した手法との間での歩み寄り・摺り合わせの可能性が、本年度の研究を通して得られた、最も斬新な示唆と言える。
|