研究目的の第一である日英対照言語デ-タとしては、天声人語の文章やサイエンティフィツクアメリカンの文章、英和、和英辞典に現れる対訳例文等を集め、かなりの量のデ-タベ-スを作成した。これは、現在および将来も増やしていく予定である。 第二の目的である日英テキストの比較対照については、文単位での対応関係を自動的に作り出すアルゴリズムを考え、そのプログラムを作った。英語の1文が日本語の2文になったり、日本語の2文が英語の1文に対応するということがあるので、これは機械的に単純に行なうことはできないが、長い文は他の言語でも長い文になっているだろうという文の長さを判断の目安として行なったところ、かなりより文対応の結果をうることができた。しかし、文の中のある長さの句が他の言語でどの句に対応するかを自動的に判断することは、日英語間では困難であることも明らかとなった。 第三の目的は、大量に記憶された対訳例文(句)を利用して、これを翻訳に利用することであり、これについては、翻訳者が訳例を簡単に検索することが出来る日英翻訳支援システムのプロトタイプを作った。種々の訳しにくい表現は、辞書でしらべてみても見出し語がなかったり、また適切な訳があたえられていなかったりする。このため、できるだけ多の訳例をデ-タベ-スに蓄積し、訳すべき表現にできるだけ近い表現をデ-タベ-スから取り出すことが中心的な問題となる。これを文字列照合の技術で実現することができた。
|