• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実施状況報告書

訳選択の根拠の自動推定とその機械翻訳における応用

研究課題

研究課題/領域番号 25730136
研究機関奈良先端科学技術大学院大学

研究代表者

NEUBIG Graham  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (70633428)

研究期間 (年度) 2013-04-01 – 2016-03-31
キーワード機械翻訳 / 訳選択 / 自然言語処理 / 機械学習 / 評価尺度
研究実績の概要

本年度は主に訳選択の根拠の自動発見技術と、訳選択の根拠を考慮した翻訳システムの構築に取り組み3つの成果があった。
成果1は、現在の翻訳システムが引き起こす誤りを効率的に分析する手法である。具体的な手法として、システムが出力した訳出結果と実際に人間が作成した正解訳を比較し、体系的に異なる箇所を誤りの可能性が高いとして指摘する。評価の結果、従来の分析法に比べて、効率的に誤りを発見することができることが分かった。この技術を成果2の分析の際に使用している。
成果2は、2種類の訳選択誤りの分析である。1種類目は、翻訳システムによって1つの単語の訳を生成させ、翻訳者に分析させたものである。2種類目は実際に様々なシステムに文を生成させ、その誤りを分析したものである。この分析の結果、訳選択の根拠や、訳選択が実際のシステムで失敗するケースを明らかにした。具体的には、語義曖昧性による訳選択の失敗は述語と項の関係や、口語か文語などのスタイルが重要な要因であることが分かった。
成果3は、ルールベースシステムが使っているような処理を統語情報を用いた統計翻訳への反映手法である。具体的には「は」「が」「を」などの助詞を選択する根拠を中心に、人間により記述したルールを導入した手法1つと、対訳データから自動学習した手法1つを調査した。具体的には、名詞句が主語を表しているか、目的語を表しているかを構文解析の結果に基づいて特定し、適切な助詞を入れやすくするように統計翻訳の入力を編集するルールを作成した。システムへの導入の結果、英日翻訳において、助詞を翻訳する精度が大幅に向上した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

26年度の目標はおおむね順調に達成している。
訳選択の根拠の調査に関して、2種類の調査を行い、有用な知見を獲得した。その中で、語義の曖昧性、原言語に含まれない単語の誤訳、単語の誤削除などを問題として特定し、これらの問題の解決策について考察した。
訳選択の根拠の自動発見技術と翻訳への反映に関して、英日翻訳における助詞の選択という、原言語に含まれない情報の代表において、確実な成果を上げている。従来の統語情報に基づく統計的機械翻訳と比較して、大幅な精度向上を実現しており、有用性が確認されている。
また、当初の予定に含まれていなかったが、分析を行っている内に必要性が明らかとなった誤り分析の効率化技術に関する研究も行われた。

今後の研究の推進方策

27年度において、主に2つの課題に取り組む予定である。
まずは、訳選択の根拠の自動発見と翻訳システムへの反映を更に一般化する予定である。26年度で英日翻訳の助詞の翻訳で有用性が確認された枠組みを、更に文駅の結果で明らかになった他の誤り原因へと拡張する予定である。例えば、名詞や動詞の語彙選択や、主語の補完などが挙げられる。
また、27年度の予定であった訳選択の安定性を評価する評価尺度の開発にも取り組む。具体的には、訳選択の安定性を評価するために作られたデータに基づく尺度と、自然発生する翻訳データに基づく尺度という2種類の尺度を検討する。

次年度使用額が生じた理由

若干の残高が残ったが、ほぼ予定通りに予算を執行している。

次年度使用額の使用計画

今年度は当初の予定通り、システムの評価やデータの作成、成果発表のための旅費などを中心に、従来の予算と合わせて使用していく予定である。

  • 研究成果

    (17件)

すべて 2015 2014 その他

すべて 雑誌論文 (5件) (うち査読あり 5件、 オープンアクセス 5件、 謝辞記載あり 4件) 学会発表 (9件) (うち招待講演 2件) 備考 (3件)

  • [雑誌論文] Multi-Target Machine Translation with Multi-Synchronous Context-free Grammars2015

    • 著者名/発表者名
      Graham Neubig, Philip Arthur, Kevin Duh
    • 雑誌名

      Proceedings of the Meeting of the North American Chapter of the Association for Computational Linguistics (NAACL)

      巻: - ページ: -

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] On the Elements of an Accurate Tree-to-String Machine Translation System2014

    • 著者名/発表者名
      Graham Neubig, Kevin Duh
    • 雑誌名

      Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics (ACL)

      巻: - ページ: 143-149

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] Discriminative Language Models as a Tool for Machine Translation Error Analysis2014

    • 著者名/発表者名
      Koichi Akabe, Graham Neubig, Sakriani Sakti, Tomoki Toda, Satoshi Nakamura
    • 雑誌名

      Proceedings of the 25th International Conference on Computational Linguistics (COLING)

      巻: - ページ: 1124-1132

    • 査読あり / オープンアクセス
  • [雑誌論文] Forest-to-String SMT for Asian Language Translation: NAIST at WAT 20142014

    • 著者名/発表者名
      Graham Neubig
    • 雑誌名

      Proceedings of the 2014 Workshop on Asian Translation

      巻: - ページ: 20-25

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] Rule-based Syntactic Preprocessing for Syntax-based Machine Translation2014

    • 著者名/発表者名
      Yuto Hatakoshi, Graham Neubig, Sakriani Sakti, Tomoki Toda, Satoshi Nakamura
    • 雑誌名

      Proceedings of the 8th Workshop on Syntax, Semantics and Structure in Statistical Translation (SSST).

      巻: - ページ: 34-42

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [学会発表] Project Nextにおける機械翻訳の誤り分析2015

    • 著者名/発表者名
      赤部 晃一, Graham Neubig, 工藤 拓, John Richardson, 中澤 敏明, 星野 翔
    • 学会等名
      エラー分析ワークショップ
    • 発表場所
      京都大学(京都府京都市)
    • 年月日
      2015-03-20
  • [学会発表] 複数の目的言語の同時生成による統計的機械翻訳2015

    • 著者名/発表者名
      Graham Neubig, Philip Arthur, Kevin Duh
    • 学会等名
      言語処理学会第21回年次大会(NLP2015)
    • 発表場所
      京都大学(京都府京都市)
    • 年月日
      2015-03-19
  • [学会発表] 機械翻訳の誤り箇所選択法における誤選択箇所の調査2015

    • 著者名/発表者名
      赤部 晃一, Graham Neubig, Sakriani Sakti, 戸田 智基, 中村 哲
    • 学会等名
      言語処理学会第21回年次大会(NLP2015)
    • 発表場所
      京都大学(京都府京都市)
    • 年月日
      2015-03-19
  • [学会発表] Tree-to-String 翻訳における構文解析器の自己学習の効果2015

    • 著者名/発表者名
      波多腰 優斗, Graham Neubig, Sakriani Sakti, 戸田 智基, 中村 哲
    • 学会等名
      言語処理学会第21回年次大会(NLP2015)
    • 発表場所
      京都大学(京都府京都市)
    • 年月日
      2015-03-18
  • [学会発表] 日本語を対象とした統計的機械翻訳の進展2015

    • 著者名/発表者名
      Graham Neubig
    • 学会等名
      第6回産業日本語研究会・シンポジウム
    • 発表場所
      東京大学(東京都文京区)
    • 年月日
      2015-02-24
    • 招待講演
  • [学会発表] パラフレーズを考慮した機械翻訳の誤り箇所選択2014

    • 著者名/発表者名
      赤部 晃一, Graham Neubig, Sakriani Sakti, 戸田 智基, 中村 哲
    • 学会等名
      情報処理学会 第219回自然言語処理研究会(SIG-NL)
    • 発表場所
      東京工業大学(神奈川県横浜市)
    • 年月日
      2014-12-17
  • [学会発表] 統語ベース翻訳に対する統語的前処理の適用2014

    • 著者名/発表者名
      波多腰 優斗, Graham Neubig, Sakriani Sakti, 戸田 智基, 中村 哲
    • 学会等名
      情報処理学会 第217回自然言語処理研究会(SIG-NL)
    • 発表場所
      オホーツク文化交流センター(北海道網走市)
    • 年月日
      2014-07-03
  • [学会発表] 機械翻訳 ~なぜできなかったのか?なぜできるようになりつつあるのか?~2014

    • 著者名/発表者名
      Graham Neubig
    • 学会等名
      音学シンポジウム
    • 発表場所
      日本大学(東京都世田谷区)
    • 年月日
      2014-05-25
    • 招待講演
  • [学会発表] 機械翻訳システムの詳細な誤り分析のための誤り順位付け手法2014

    • 著者名/発表者名
      赤部 晃一, Graham Neubig, Sakriani Sakti, 戸田 智基, 中村 哲
    • 学会等名
      情報処理学会 第216回自然言語処理研究会(SIG-NL)
    • 発表場所
      東京工業大学(東京都目黒区)
    • 年月日
      2014-05-22
  • [備考] 本研究の一環として開発されたTravatar Toolkitの日英翻訳デモページ

    • URL

      http://ahclab.naist.jp/travatar/translator/

  • [備考] ACL2014で発表した成果の概要を説明するウェブページ

    • URL

      http://phontron.com/project/neubig14acl/

  • [備考] NAACL2015で発表した成果の概要を説明するウェブページ

    • URL

      http://phontron.com/project/naacl2015/

URL: 

公開日: 2016-06-01  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi