• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2018 年度 研究成果報告書

マルチリソース適応によるローリソースニューラル機械翻訳の高度化

研究課題

  • PDF
研究課題/領域番号 17H06822
研究種目

研究活動スタート支援

配分区分補助金
研究分野 知能情報学
研究機関大阪大学

研究代表者

チョ シンキ  大阪大学, データビリティフロンティア機構, 特任助教(常勤) (70784891)

研究協力者 Dabre Raj  
研究期間 (年度) 2017-08-25 – 2019-03-31
キーワードニューラル機械翻訳 / 分野適応 / 低資源
研究成果の概要

外国人観光客の急増や2020年東京オリンピック開催などのため、翻訳の需要が急速に高まっており、機械翻訳(MT)は不可欠である。MTでは翻訳知識が対訳コーパス(文単位のバイリンガルテキスト)から獲得される。しかし、日本語とほとんどの言語の間(例えばインドネシア語)及び分野(例えば医療)において対訳コーパスは少ないため、翻訳の品質が低い。そのような低資源の場合にいかに翻訳精度を上げるかは挑戦的かつ未解決な問題である。我々は資源豊富な言語対(例えば英語ーフランス語)や分野(例えば議会)の対訳コーパス及び単言語コーパスといったマルチリソースを用いて低資源MTの翻訳品質を大幅に向上した。

自由記述の分野

機械翻訳

研究成果の学術的意義や社会的意義

深層学習に基づくニューラル機械翻訳(NMT)の発展により、大規模な対訳コーパスが入手できる場合に最先端の翻訳精度を達成したが、対訳コーパスが少量な場合に翻訳精度が低いことが知られている。しかし、特定言語対や分野の対訳コーパスが大量に存在しない場面が数々ある。例えば、2020年東京オリンピックでは、日本語から東南アジア言語へのスポーツ分野でのMTサービスが非常に重要だと思われるが、それらの言語対や分野において対訳コーパスは少量かほとんど存在しない。本研究で提案したマルチリソース適用はそのような低資源のNMTの翻訳精度向上に成功し、MTの実用化をさらに前進させた。

URL: 

公開日: 2020-03-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi