研究課題/領域番号 |
16650032
|
研究機関 | 国文学研究資料館 |
研究代表者 |
野本 忠司 国文学研究資料館, 複合領域研究系, 助教授 (20321557)
|
研究分担者 |
石川 彰 上智大学, 外国語学部, 教授 (10138373)
宇津呂 武仁 京都大学, 大学院・情報学研究科, 講師 (90263433)
原 正一郎 国文学研究資料館, 複合領域研究系, 助教授 (50218616)
|
キーワード | 機械翻訳 / 言語モデル / 機械学習 / 信頼性モデル |
研究概要 |
本年度は、アンサンブル型言語モデル(voted language model)による機械翻訳の品質判定モデルの有効性について検討した。言語モデルは、翻訳品質モデルにおいて、翻訳出力の言語的な自然さを計量する手段として導入されているが、アンサンブル型言語モデルは、ドメインの異なるデータで学習した複数の言語モデルを翻訳出力に適用し、perplexityに基づいてそのつど最適な言語モデルを選択するというところに大きな特徴を持つ。 今回は、アンサンブル型言語モデルを導入した翻訳品質モデルを用いて、新聞、特許の英日機械翻訳の品質判定を行った結果、本アプローチの有効性が確認された。
|