• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Research-status Report

訳選択の根拠の自動推定とその機械翻訳における応用

Research Project

Project/Area Number 25730136
Research InstitutionNara Institute of Science and Technology

Principal Investigator

NEUBIG Graham  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (70633428)

Project Period (FY) 2013-04-01 – 2016-03-31
Keywords機械翻訳 / 訳選択 / 自然言語処理 / 機械学習 / 評価尺度
Outline of Annual Research Achievements

本年度は主に訳選択の根拠の自動発見技術と、訳選択の根拠を考慮した翻訳システムの構築に取り組み3つの成果があった。
成果1は、現在の翻訳システムが引き起こす誤りを効率的に分析する手法である。具体的な手法として、システムが出力した訳出結果と実際に人間が作成した正解訳を比較し、体系的に異なる箇所を誤りの可能性が高いとして指摘する。評価の結果、従来の分析法に比べて、効率的に誤りを発見することができることが分かった。この技術を成果2の分析の際に使用している。
成果2は、2種類の訳選択誤りの分析である。1種類目は、翻訳システムによって1つの単語の訳を生成させ、翻訳者に分析させたものである。2種類目は実際に様々なシステムに文を生成させ、その誤りを分析したものである。この分析の結果、訳選択の根拠や、訳選択が実際のシステムで失敗するケースを明らかにした。具体的には、語義曖昧性による訳選択の失敗は述語と項の関係や、口語か文語などのスタイルが重要な要因であることが分かった。
成果3は、ルールベースシステムが使っているような処理を統語情報を用いた統計翻訳への反映手法である。具体的には「は」「が」「を」などの助詞を選択する根拠を中心に、人間により記述したルールを導入した手法1つと、対訳データから自動学習した手法1つを調査した。具体的には、名詞句が主語を表しているか、目的語を表しているかを構文解析の結果に基づいて特定し、適切な助詞を入れやすくするように統計翻訳の入力を編集するルールを作成した。システムへの導入の結果、英日翻訳において、助詞を翻訳する精度が大幅に向上した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

26年度の目標はおおむね順調に達成している。
訳選択の根拠の調査に関して、2種類の調査を行い、有用な知見を獲得した。その中で、語義の曖昧性、原言語に含まれない単語の誤訳、単語の誤削除などを問題として特定し、これらの問題の解決策について考察した。
訳選択の根拠の自動発見技術と翻訳への反映に関して、英日翻訳における助詞の選択という、原言語に含まれない情報の代表において、確実な成果を上げている。従来の統語情報に基づく統計的機械翻訳と比較して、大幅な精度向上を実現しており、有用性が確認されている。
また、当初の予定に含まれていなかったが、分析を行っている内に必要性が明らかとなった誤り分析の効率化技術に関する研究も行われた。

Strategy for Future Research Activity

27年度において、主に2つの課題に取り組む予定である。
まずは、訳選択の根拠の自動発見と翻訳システムへの反映を更に一般化する予定である。26年度で英日翻訳の助詞の翻訳で有用性が確認された枠組みを、更に文駅の結果で明らかになった他の誤り原因へと拡張する予定である。例えば、名詞や動詞の語彙選択や、主語の補完などが挙げられる。
また、27年度の予定であった訳選択の安定性を評価する評価尺度の開発にも取り組む。具体的には、訳選択の安定性を評価するために作られたデータに基づく尺度と、自然発生する翻訳データに基づく尺度という2種類の尺度を検討する。

Causes of Carryover

若干の残高が残ったが、ほぼ予定通りに予算を執行している。

Expenditure Plan for Carryover Budget

今年度は当初の予定通り、システムの評価やデータの作成、成果発表のための旅費などを中心に、従来の予算と合わせて使用していく予定である。

  • Research Products

    (17 results)

All 2015 2014 Other

All Journal Article (5 results) (of which Peer Reviewed: 5 results,  Open Access: 5 results,  Acknowledgement Compliant: 4 results) Presentation (9 results) (of which Invited: 2 results) Remarks (3 results)

  • [Journal Article] Multi-Target Machine Translation with Multi-Synchronous Context-free Grammars2015

    • Author(s)
      Graham Neubig, Philip Arthur, Kevin Duh
    • Journal Title

      Proceedings of the Meeting of the North American Chapter of the Association for Computational Linguistics (NAACL)

      Volume: - Pages: -

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] On the Elements of an Accurate Tree-to-String Machine Translation System2014

    • Author(s)
      Graham Neubig, Kevin Duh
    • Journal Title

      Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics (ACL)

      Volume: - Pages: 143-149

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] Discriminative Language Models as a Tool for Machine Translation Error Analysis2014

    • Author(s)
      Koichi Akabe, Graham Neubig, Sakriani Sakti, Tomoki Toda, Satoshi Nakamura
    • Journal Title

      Proceedings of the 25th International Conference on Computational Linguistics (COLING)

      Volume: - Pages: 1124-1132

    • Peer Reviewed / Open Access
  • [Journal Article] Forest-to-String SMT for Asian Language Translation: NAIST at WAT 20142014

    • Author(s)
      Graham Neubig
    • Journal Title

      Proceedings of the 2014 Workshop on Asian Translation

      Volume: - Pages: 20-25

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] Rule-based Syntactic Preprocessing for Syntax-based Machine Translation2014

    • Author(s)
      Yuto Hatakoshi, Graham Neubig, Sakriani Sakti, Tomoki Toda, Satoshi Nakamura
    • Journal Title

      Proceedings of the 8th Workshop on Syntax, Semantics and Structure in Statistical Translation (SSST).

      Volume: - Pages: 34-42

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Presentation] Project Nextにおける機械翻訳の誤り分析2015

    • Author(s)
      赤部 晃一, Graham Neubig, 工藤 拓, John Richardson, 中澤 敏明, 星野 翔
    • Organizer
      エラー分析ワークショップ
    • Place of Presentation
      京都大学(京都府京都市)
    • Year and Date
      2015-03-20
  • [Presentation] 複数の目的言語の同時生成による統計的機械翻訳2015

    • Author(s)
      Graham Neubig, Philip Arthur, Kevin Duh
    • Organizer
      言語処理学会第21回年次大会(NLP2015)
    • Place of Presentation
      京都大学(京都府京都市)
    • Year and Date
      2015-03-19
  • [Presentation] 機械翻訳の誤り箇所選択法における誤選択箇所の調査2015

    • Author(s)
      赤部 晃一, Graham Neubig, Sakriani Sakti, 戸田 智基, 中村 哲
    • Organizer
      言語処理学会第21回年次大会(NLP2015)
    • Place of Presentation
      京都大学(京都府京都市)
    • Year and Date
      2015-03-19
  • [Presentation] Tree-to-String 翻訳における構文解析器の自己学習の効果2015

    • Author(s)
      波多腰 優斗, Graham Neubig, Sakriani Sakti, 戸田 智基, 中村 哲
    • Organizer
      言語処理学会第21回年次大会(NLP2015)
    • Place of Presentation
      京都大学(京都府京都市)
    • Year and Date
      2015-03-18
  • [Presentation] 日本語を対象とした統計的機械翻訳の進展2015

    • Author(s)
      Graham Neubig
    • Organizer
      第6回産業日本語研究会・シンポジウム
    • Place of Presentation
      東京大学(東京都文京区)
    • Year and Date
      2015-02-24
    • Invited
  • [Presentation] パラフレーズを考慮した機械翻訳の誤り箇所選択2014

    • Author(s)
      赤部 晃一, Graham Neubig, Sakriani Sakti, 戸田 智基, 中村 哲
    • Organizer
      情報処理学会 第219回自然言語処理研究会(SIG-NL)
    • Place of Presentation
      東京工業大学(神奈川県横浜市)
    • Year and Date
      2014-12-17
  • [Presentation] 統語ベース翻訳に対する統語的前処理の適用2014

    • Author(s)
      波多腰 優斗, Graham Neubig, Sakriani Sakti, 戸田 智基, 中村 哲
    • Organizer
      情報処理学会 第217回自然言語処理研究会(SIG-NL)
    • Place of Presentation
      オホーツク文化交流センター(北海道網走市)
    • Year and Date
      2014-07-03
  • [Presentation] 機械翻訳 ~なぜできなかったのか?なぜできるようになりつつあるのか?~2014

    • Author(s)
      Graham Neubig
    • Organizer
      音学シンポジウム
    • Place of Presentation
      日本大学(東京都世田谷区)
    • Year and Date
      2014-05-25
    • Invited
  • [Presentation] 機械翻訳システムの詳細な誤り分析のための誤り順位付け手法2014

    • Author(s)
      赤部 晃一, Graham Neubig, Sakriani Sakti, 戸田 智基, 中村 哲
    • Organizer
      情報処理学会 第216回自然言語処理研究会(SIG-NL)
    • Place of Presentation
      東京工業大学(東京都目黒区)
    • Year and Date
      2014-05-22
  • [Remarks] 本研究の一環として開発されたTravatar Toolkitの日英翻訳デモページ

    • URL

      http://ahclab.naist.jp/travatar/translator/

  • [Remarks] ACL2014で発表した成果の概要を説明するウェブページ

    • URL

      http://phontron.com/project/neubig14acl/

  • [Remarks] NAACL2015で発表した成果の概要を説明するウェブページ

    • URL

      http://phontron.com/project/naacl2015/

URL: 

Published: 2016-06-01  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi