• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2009 Fiscal Year Annual Research Report

多言語対訳コーパスを用いた言語間距離の計算とその応用

Research Project

Project/Area Number 19500137
Research InstitutionNational Institute of Information and Communications Technology

Principal Investigator

隅田 英一郎  National Institute of Information and Communications Technology, 知識創成コミュニケーション研究センター・言語翻訳グループ, グループリーダー (90395020)

Keywords自然言語処理
Research Abstract

(A)距離計算方式の提案と実装
構文利用の翻訳方式の提案・実装、双方向翻訳方式の提案と実装、対訳に基づいて学習する形態素解析手法の提案と実装、換言による翻訳方式の提案と実装、動的モデル統合法の提案と実装、双方向翻字の提案と実装など、翻訳の基本方式の改良を行い、多数の言語対によって、翻訳手法の汎用性を確認した。これに基づいて昨年度提案した言語間距離を計算する基本方式を拡張し、多数の言語対について言語学的な類型論と矛盾しない計算結果を得た。
(B)学習時間と現在まで考案した言語間距離(翻訳困難度)の関係
米国の調査「英語話者が外国語の集中コースによって上級レベルに到達するまでの学習時間」は、(1)フランス語、ドイツ語、スペイン語は20週、(2)アラビア語、中国語、日本語は44週となっている。英語と(1)の言語の言語間距離(翻訳困難度)は、英語と(2)の言語の言語間距離(翻訳困難度)より小さいので学習時間とおおむね相関する。ただ、アラビア語、中国語、日本語は同じ(2)の学習時間であるが、言語間距離に関して、アラビア語、中国語、日本語の順に距離が大きく異なったので、学習時間との関係を説明するためには、さらに、言語間距離の計算手法の改善を要することがわかった。
(C)多言語の翻訳システムの作成
21言語(英、独、デンマーク、オランダ、仏、イタリア、スペイン、ポルトガル、ブラジル、日本、北京、韓国、ロシア、アラビア、ヒンディ、インドネシア、マレー、タイ、タガログ、ベトナム、台湾華語)の翻訳システムを構築し、ネットワーク経由でiPhoneで利用するシステムを構築した。

  • Research Products

    (13 results)

All 2010 2009

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (8 results) Patent(Industrial Property Rights) (2 results)

  • [Journal Article] A Reordering Model Using a Source-Side Parse-Tree for Statistical Machine Translation2009

    • Author(s)
      橋本佳
    • Journal Title

      IEICE TRANSACTIONS on Information and Systems Vol.E92-D, No.12

      Pages: 2386-2393

    • Peer Reviewed
  • [Journal Article] Class-dependent Modeling for Dialog Translation. IEICE TRANSACTION on Information Systems2009

    • Author(s)
      Andrew Finch
    • Journal Title

      IEICE TRANSACTIONS on Information and Systems Vol.E92-D, No.12

      Pages: 2378-2385

    • Peer Reviewed
  • [Journal Article] Imposing Constraints from the Source Tree on ITG Constraints for SMT2009

    • Author(s)
      山本博史
    • Journal Title

      IEICE TRANSACTIONS on Information and Systems Vol.E92-D, No.9

      Pages: 1762-1770

    • Peer Reviewed
  • [Presentation] パラフレーズラティスを用いた統計的機械翻訳2010

    • Author(s)
      大西貴士
    • Organizer
      言語処理学会 第16回年次大会
    • Place of Presentation
      東京大学(東京)
    • Year and Date
      2010-03-11
  • [Presentation] Exploiting Directional Asymmetry in Phrase-table Generation for Statistical Machine Translation2010

    • Author(s)
      Andrew Finch
    • Organizer
      言語処理学会 第16回年次大会
    • Place of Presentation
      東京大学(東京)
    • Year and Date
      2010-03-11
  • [Presentation] Effects of Integrating Multiple Bilingually-Trained Segmentation Schemes for Japanese-English SMT2010

    • Author(s)
      Michael Paul
    • Organizer
      言語処理学会 第16回年次大会
    • Place of Presentation
      東京大学(東京)
    • Year and Date
      2010-03-11
  • [Presentation] Language Independent Word Segmentation for Statistical Machine Translation2009

    • Author(s)
      Michael Paul
    • Organizer
      3rd International Universal Communication Symposium
    • Place of Presentation
      日本科学未来館(東京)
    • Year and Date
      2009-12-03
  • [Presentation] Transliteration by Bidirectional Statistical Machine Translation2009

    • Author(s)
      A. Finch, 隅田英一郎
    • Organizer
      The 2009 Named Entities Workshop, ACL-IJCNLP 2009
    • Place of Presentation
      Suntec(シンガポール)
    • Year and Date
      2009-08-07
  • [Presentation] Bidirectional Phrase-based Statistical Machine Translation2009

    • Author(s)
      A. Finch, 隅田英一郎
    • Organizer
      The 2009 Conference on Empirical Methods in Natural Language Processing
    • Place of Presentation
      Suntec(シンガポール)
    • Year and Date
      2009-08-06
  • [Presentation] Reordering Model Using Syntactic Information of a Source Tree for Statistical Machine Translation2009

    • Author(s)
      橋本佳
    • Organizer
      SSST-3, Third Workshop on Syntax and Structure in Statistical Translation
    • Place of Presentation
      University of Colorado at Boulder(米国)
    • Year and Date
      2009-06-05
  • [Presentation] On the Importance of Pivot Language Selection for Statistical Machine Translation2009

    • Author(s)
      M. Paul, 山本博史, 大熊英男, 隅田英一郎, 中村哲
    • Organizer
      NAACL HLT 2009
    • Place of Presentation
      University of Colorado at Boulder(米国)
    • Year and Date
      2009-06-02
  • [Patent(Industrial Property Rights)] 機械翻訳装置、機械翻訳方法、およびプログラム2010

    • Inventor(s)
      大西貴士, 内山将夫, 隅田英一郎
    • Industrial Property Rights Holder
      (独)情報通信研究機構
    • Industrial Property Number
      特許、特願2010-044213
    • Filing Date
      2010-03-01
  • [Patent(Industrial Property Rights)] Language Independent Word Segmentation for Statistical Machine Translation2009

    • Inventor(s)
      M.Paul, A.Finch, 隅田英一郎
    • Industrial Property Rights Holder
      (独)情報通信研究機構
    • Industrial Property Number
      特許、特願2009-273137
    • Filing Date
      2009-12-01

URL: 

Published: 2011-06-16   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi