2013 Fiscal Year Annual Research Report
統計・用例機械翻訳のためのアラインメント向上と多言語文法パターン公開
Project/Area Number |
23500187
|
Research Institution | Waseda University |
Principal Investigator |
LEPAGE YVES 早稲田大学, 理工学術院, 教授 (70573608)
|
Keywords | 自然言語処理 / 機械翻訳 / 翻訳テーブル / アラインメント |
Research Abstract |
最後年度で二つの主な研究について取り組んだ。本研究の課題になる文部分的アライナーで生成される翻訳テーブルを(1)統計機械翻訳階層モデルと(2)用例翻訳に適応の可能性を検討した。(1)統計機械翻訳階層モデルでは、翻訳見出しがルールのようなものになり、変数を含めるものである。文部分的アライナーの基本機能として不連続な見出しの出力が可能であるため、ルールに変換するたことを検討した。 翻訳パターンを生成してから、源言語と目的言語のパターンの変数の対訳関係を特定するため計算量の問題が会って、サンプリングで計算量の減少ができた。完全な計算と比べて、ルールのエラーは3%だけがあり、翻訳品質に影響はないと示した。(2)本研究室で開発中の用例翻訳エンジンに対して、統計翻訳のための翻訳テーブルの見出しは短かすぎるため、翻訳は不可能であることを予備実験で証明した。概して翻訳テーブル見出しは文の長さまでのものが必要となる。先行研究で提案された手法は文中の最弱点を位置づけることによって、分かち書きを行なう「加切性」という手法の検討した。また、2012年度に開発した二カ国語同時構文解析を50倍以上の加速化し、その応用可能性を検討した。 ここは、最高技術標準の翻訳品質にはまだ及ばない。 本研究の予算で本研究室のネットワークを再建した。また、データと成果の公開のためサーバを購入した。三年間で主な実験設定で得られた翻訳テーブルとその翻訳品質結果をそのサーバーで公開した。
|
Research Products
(12 results)