研究課題/領域番号 |
17H06822
|
研究種目 |
研究活動スタート支援
|
配分区分 | 補助金 |
研究分野 |
知能情報学
|
研究機関 | 大阪大学 |
研究代表者 |
チョ シンキ 大阪大学, データビリティフロンティア機構, 特任助教(常勤) (70784891)
|
研究協力者 |
Dabre Raj
|
研究期間 (年度) |
2017-08-25 – 2019-03-31
|
研究課題ステータス |
完了 (2018年度)
|
配分額 *注記 |
2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
2018年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2017年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | ニューラル機械翻訳 / 分野適応 / 低資源 / 機械翻訳 / ローリソース / ドメイン適応 / マルチリソース適応 |
研究成果の概要 |
外国人観光客の急増や2020年東京オリンピック開催などのため、翻訳の需要が急速に高まっており、機械翻訳(MT)は不可欠である。MTでは翻訳知識が対訳コーパス(文単位のバイリンガルテキスト)から獲得される。しかし、日本語とほとんどの言語の間(例えばインドネシア語)及び分野(例えば医療)において対訳コーパスは少ないため、翻訳の品質が低い。そのような低資源の場合にいかに翻訳精度を上げるかは挑戦的かつ未解決な問題である。我々は資源豊富な言語対(例えば英語ーフランス語)や分野(例えば議会)の対訳コーパス及び単言語コーパスといったマルチリソースを用いて低資源MTの翻訳品質を大幅に向上した。
|
研究成果の学術的意義や社会的意義 |
深層学習に基づくニューラル機械翻訳(NMT)の発展により、大規模な対訳コーパスが入手できる場合に最先端の翻訳精度を達成したが、対訳コーパスが少量な場合に翻訳精度が低いことが知られている。しかし、特定言語対や分野の対訳コーパスが大量に存在しない場面が数々ある。例えば、2020年東京オリンピックでは、日本語から東南アジア言語へのスポーツ分野でのMTサービスが非常に重要だと思われるが、それらの言語対や分野において対訳コーパスは少量かほとんど存在しない。本研究で提案したマルチリソース適用はそのような低資源のNMTの翻訳精度向上に成功し、MTの実用化をさらに前進させた。
|