昨年度に引き続き、多言語間検索サーバの開発を行った。本年度は辞書を強化することを中心に、ユーザーインタフェイス、データ保存効率の向上など、細部にも開発を行ったが、残念ながら中心である辞書強化において思うように開発が進まなかった面もある。またインフラとしては、実験用サーバを強化したので、来年度本稼動させることにより、研究開発効率の向上が期待できる。 また、今年度より、インターネット上の情報が、法律に関連するものかどうかを自動的に判断するプログラムの開発研究を開始した。具体的にはSVM(Support Vector Machine)と呼ばれる手法を用い、コンピュータに法律関連情報の特徴を学習させることを目指したものである。今年度は手始めに日本語の法令および判例情報をその他の一般情報と判別する試みを行った。 また検討が不十分な点もあるが次のようなことが現在わかっている。法令情報と判例情報ではその特徴が大きく異なり、単純な2値判別によるSVMでは自動判別の精度はあまりよくない。しかし、SVMを多値判別に拡張し、さらにパラメータ等を十分に調整する等の工夫を行うことにより、かなり高精度の判別結果を得ることができる。 インターネット上での共同翻訳のための支援ツールについては、まだテスト的なものではあるが、翻訳協力者が翻訳した文章に別の翻訳者がコメントを付したり、改訂するような仕組みを作成することができた。
|