研究課題
基盤研究(C)
本研究の目的は、1。単言語データから類推関係クラスターを構築し、2。そのクラスターから擬似パラレルコーパスを生成し、3。パラレルコーパスに追加することにより4。統計的機械翻訳(SMT)の精度を向上させる。そのため、様々なツールを実装し公開した。新しいデータ構造も導入した:類推関係グリッド。形態的に貧しい言語を始め形態豊かな言語を渡って様々な言語でデータを構築した:欧州連合の11ヶ国語、中国語、日本語、また追加言語(アラビア語、グルジア語、ナバホ語、ロシア語、トルコ語)。データの一部分は公開した。行った実験で擬似パラレルコーパスの追加により日中SMTの翻訳精度を向上することを明らかにした。
すべて 2018 2017 2016 その他
すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 2件、 謝辞記載あり 2件) 学会発表 (15件) (うち招待講演 3件) 備考 (2件)
Journal of Information Processing
巻: 25 号: 0 ページ: 88-99
10.2197/ipsjjip.25.88
130005292406
IEEJ Transactions in Electronics, Information and Systems
巻: 11(3) 号: 3 ページ: 325-330
10.1002/tee.22221
http://lepage-lab.ips.waseda.ac.jp/index.php/2016-08-01-06-37-56/kakenhi-2/kakenhi-2-experiment-result