研究成果の概要 |
まず、2000年以降に無償で公開された9種の既存の日英・英日パラレルコーパスのフォーマットを統一し、串刺し検索できるように整備した。重複が見られるノイズ等についても削除し、その結果、英語・日本語それぞれ4000万語弱のパラレルコーパスが完成した。 次に、これら整備した9種の日英・英日パラレルコーパスを瞬時に検索できるワードプロファイラーを開発した。Ver.1.0, 1.1, 1.2では、日本語から英語の翻訳方向で検索できるシステムを開発した。起点言語となる日本語のパターン検索機能、コロケーション抽出機能、用例+対訳の表示機能などを搭載 し、ジャンル別の用例数も表示を可能にした。
|