2009 年度実績報告書

単語・フレーズ・言語モデルを統合したフレーズ並び替えモデルに基づく統計的機械翻訳

研究課題

研究課題/領域番号	21300048
研究機関	筑波大学
研究代表者	山本幹雄筑波大学, 大学院・システム情報工学研究科, 教授 (40210562)
研究分担者	乾孝司筑波大学, 大学院・システム情報工学研究科, 助教 (60397031)
キーワード	多言語処理 / 人工知能 / 自然言語処理 / 並び替えモデル / 言語モデル / 統計的機械翻訳
研究概要	本研究では、統計的機械翻訳におけるフレーズ並び替えモデルに焦点をあて、現在普及している代表的な3つのモデル(隣接フレーズモデル、構文モデル、言語モデル)の違いや利点と欠点を検討し、日英翻訳のような比較的遠い言語間の翻訳でも有効に機能する並び替えモデルを開発することを目的としている。平成21年度は、従来法の比較検討のフェーズとして位置づけ、比較的大規模な実験データ(特許文書から抽出された180万文の日英対訳データ)を用いて、実証的に各種モデルの優劣や利点と欠点、さらには言語モデルと他並び替えモデルとの親和性について検討した。研究成果として、比較的高精度な日英統計的機械翻訳システムの場合、次の2点が明らかになった。1、言語モデルは単語の並び替えモデルとしでの働きがあり、言語モデルの高精度化は日英翻訳システム全体の高精度化に極めて有効である。2、日英翻訳においては、高精度な言語モデルを用いた場合、隣接フレーズモデルよりも構文モデルの方が高性能な翻訳を可能とするモデルであった。また、言語モデルとの親和性については次の2点を明らかにした。1、隣接フレーズモデルと言語モデルは競合的な性質がある。すなわち、どちらも最高性能のモデルを利用すると全体として精度が下がってしまう。2、構文モデルと言語モデルには親和性がある。すなわち、どちらも最高性能のモデルを用いた場合が全体としても最も性能が高くなった。今後の研究方向としては、特に構文モデルと言語モデルの親和性(協働して高性能となる)の性質を発展させ、翻訳モデル全体を含めた高性能なモデルを開発する予定である。

研究成果

(5件)

すべて 2010 2009

すべて雑誌論文 (3件) (うち査読あり 3件) 学会発表 (1件) 図書 (1件)

[雑誌論文] Exploiting Patent Information for the Evaluation of Machine Translation2009
- 著者名/発表者名
  Atsushi Fujii
- 雑誌名
  
  MT Summit XII 3rd Workshop on Patent Translation
- 査読あり
[雑誌論文] Meta-Evaluation of Automatic Evaluation Methods for Machine Translation using Patent Translation Data in NTCIR-72009
- 著者名/発表者名
  Hiroshi Echizen-ya
- 雑誌名
  
  Summit XII 3rd Workshop on Patent Translation
- 査読あり
[雑誌論文] Evaluating Effects of Machine Translation Accuracy on Cross-Lingual Patent Retrieval2009
- 著者名/発表者名
  Atsushi Fujii
- 雑誌名
  
  Proceedings of the 32nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval(SIGIR 2009)
  
  ページ: 674-675
- 査読あり
[学会発表] Khafra:語順並べ替えモデルに対応した動的計画法に基づくSMTデコーダ2010
- 著者名/発表者名
  安田隆浩
- 学会等名
  言語処理学会第16回年次大会
- 発表場所
  東京大学(東京都)
- 年月日
  2010-03-10
[図書] 言語処理学事典2009
- 著者名/発表者名
  言語処理学会
- 総ページ数
  913
- 出版者
  共立出版

2009 年度 実績報告書

単語・フレーズ・言語モデルを統合したフレーズ並び替えモデルに基づく統計的機械翻訳

研究代表者

山本 幹雄 筑波大学, 大学院・システム情報工学研究科, 教授 (40210562)

研究成果

[雑誌論文] Exploiting Patent Information for the Evaluation of Machine Translation2009

著者名/発表者名

雑誌名

[雑誌論文] Meta-Evaluation of Automatic Evaluation Methods for Machine Translation using Patent Translation Data in NTCIR-72009

著者名/発表者名

雑誌名

[雑誌論文] Evaluating Effects of Machine Translation Accuracy on Cross-Lingual Patent Retrieval2009

著者名/発表者名

雑誌名

[学会発表] Khafra:語順並べ替えモデルに対応した動的計画法に基づくSMTデコーダ2010

著者名/発表者名

学会等名

発表場所

年月日

[図書] 言語処理学事典2009

著者名/発表者名

総ページ数

出版者

2009 年度実績報告書

山本幹雄筑波大学, 大学院・システム情報工学研究科, 教授 (40210562)