研究概要 |
本研究では,WWW(ワールドワイドウェブ)上の多種多様な多言語文書集合を情報源として翻訳知識を発見する技術を確立することを目的として,翻訳知識発見モデルおよび翻訳知識発見インタフェースについて研究を行なった.本年度の研究項目は次の2点である. 1.多言語文書集合からの包括的翻訳知識発見モデルの研究 2.翻訳知識獲得のための知的インタフェースの研究 まず,第1点については,これまでの技術の範囲では,翻訳知識獲得の情報源がWWW上の報道記事に限定されていたが,WWW上の一般の多言語文書にまで情報源を拡張する技術について研究を行なった.具体的には,まず,翻訳知識の候補については,従来技術にしたがい,報道記事中の人名・地名・組織名などの分野固有の固有名詞(固有表現)や事象・言い回しなどについて,翻訳知識の候補を収集する.次に,これらの翻訳知識の候補の正確な順位付けを行なうために,WWW検索エンジンを用いて多様な多言語文書を収集する.そして,収集された多言語文書を統合的に利用して翻訳知識の候補の順位付けを行なう包括的翻訳知識発見モデルを考案した. 第2点については,翻訳知識の候補の順位付け規則によって得られた順位を参照しながら,簡単な操作をするだけで,利用者が必要とする翻訳知識を手軽にかつ確実に獲得できるインタフェースを開発した.このインタフェースでは,利用者が効率的に翻訳知識を発見できるように,各々の表現が出現する元文書,既存の対訳辞書や翻訳ソフトの情報等,多様な情報を簡単に閲覧できる機能を実現した.
|