Research Abstract |
本研究では,現在の機械翻訳モデルの弱点を克服することを目的として,人間の翻訳者,特に,プロの翻訳者が持つ翻訳戦略を模倣し,計算機上の機械翻訳モデルとして実現することを目的として,以下の研究を行った.(i)翻訳対象の文書の原言語解析・翻訳変換・目的言語生成といった各処理を遂行するのに際して,あらかじめモデルが持っている言語知識が十分であるか否かを検出する機構を実現する.(ii)(i)で不足していると判定された言語知識を,実世界の大規模言語資源,具体的には,WWW上の文書群から収集するための戦略を,計算機上のソフトウェアとして実現する. 本年度は,翻訳において必要な知識のうち,不足していると判定された言語知識を,WWW上の多言語文書群から獲得する技術について研究を行った.ここでは,従来より研究代表者が行ってきた翻訳知識獲得の要素技術を発展させる形で研究を行った.特に,これまでに開発した翻訳知識獲得技術は,WWW上の多言語報道記事を情報源として翻訳知識を獲得するというものであったが,本研究では,情報源を報道記事に限定せずに,WWW上の一般の多言語文書群に拡張して翻訳知識の獲得を行う.具体的には,いくつかの原言語用語およびその目的言語訳の組を「種」として,「種」の出現するページから多様な手がかりを収集し,翻訳知識獲得において有益な戦略を帰納的に発見するというアプローチをとった.ここでは,「種」となる原言語用語を用いて,翻訳対象の文書の専門分野を推定し,その専門分野の多言語文書を収集した結果から,専門分野特有の翻訳知識を獲得するという戦略であった.この汎用の戦略を,各々の専門分野に適応させて,各専門分野に特化した翻訳知識獲得の戦略を帰納的に発見するという技術の開発を行った.
|