• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2010 Fiscal Year Annual Research Report

入力文の分割・翻訳・連結による同時通訳システム

Research Project

Project/Area Number 20300058
Research InstitutionToyohashi University of Technology

Principal Investigator

稲垣 康善  豊橋技術科学大学, 大学院・工学研究科, 理事 (10023079)

Co-Investigator(Kenkyū-buntansha) 松原 茂樹  国立大学法人名古屋大学, 情報科学研究科, 准教授 (20303589)
加藤 芳秀  国立大学法人名古屋大学, 情報基盤センター, 研究員 (20362220)
笠 浩一朗  国立大学法人名古屋大学, 大学院・国際開発研究科, 助教 (40397451)
大野 誠寛  国立大学法人名古屋大学, 大学院・国際開発研究科, 助教 (20402472)
酒井 浩之  豊橋技術科学大学, 大学院・工学研究科, 助教 (70402659)
Keywords同時通訳 / 機械翻訳 / コーパス / 文分割 / 音声言語 / 機械学習 / 翻訳単位 / システム評価
Research Abstract

最終年度として、これまでに構築した言語基盤ならびに要素技術をもとに、入力文の分割、翻訳、連結に基づく同時通訳機能の実現に関する研究を推進した。
1.同時通訳機能の設計:同時通訳プロセスの基本設計を与えた。システムを構成するモジュールとして「解析」「分割」「翻訳」及び「連結」を設定し、それぞれの機能を明確化した。設計にあたっては、処理の精度に加え、通訳タイミングを重視して設計した。さらに、これらの設計を既存の同時通訳コーパスの構成に反映し、コーパスへのアノテーションの拡張を実施した。
2.同時通訳の要素技術の高性能化:これまでに開発した以下の要素技術について整備し、同時通訳機能を実現するための高性能化を推進した。
(A)入力文の解析技術:文の入力と同時進行的に解析を実行する技術を開発した。実験により、本手法が通常の文単位の構文解析システムと同程度の精度を有し、かつ、リアルタイムに実行できる解析性能を有していることを確認した。
(B)入力文の分割技術:講演文及び対話文を対象に、係り受け関係、節境界の位置・種類、ポーズ長など、分割位置に関連する要因をパラメータとする確率モデルを実装した。開発用データを用いて分割実験を繰り返し、分割に最適なパラメータとその組み合わせを決定した。
(C)分割された単位間の関係検出技術:単位間の関係を、連体修飾、主題-述語などの文法的側面から定め、それを係り受け構造を考慮して自動的に検出する確率モデルを実現した。同時通訳コーパスを用いた実験によって高い検出性能を備えていることを明らかにした
同時通訳機能を実現するために上述の諸技術を統合可能性について検証を与えた。具体的には、旅行をドメインとする対話文、及び、日常トピックを対象とした講演文をターゲットとして選定し、その実現可能性を確認することができた。

  • Research Products

    (10 results)

All 2011 2010 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (5 results) Book (1 results) Remarks (1 results)

  • [Journal Article] Correcting Syntactic Annotation Errors Using a Synchronous Tree Substitution Grammar2010

    • Author(s)
      Yoshihide Kato
    • Journal Title

      IEICE Transactions on Information and Systems

      Volume: E93-D,9 Pages: 2660-2663

    • Peer Reviewed
  • [Journal Article] Construction of Linefeed Insertion Rules for Lecture Transcript and Their Evaluation2010

    • Author(s)
      Masaki Murata
    • Journal Title

      International Journal of Knowledge and Web Intelligence

      Volume: 1,3/4 Pages: 227-242

    • Peer Reviewed
  • [Journal Article] Cross-Bootstrapping:特許文書からの課題・効果表現対の自動抽出手法2010

    • Author(s)
      坂地泰紀
    • Journal Title

      電子情報通信学会論文誌

      Volume: J93-D,6 Pages: 742-755

    • Peer Reviewed
  • [Presentation] 手がかり表現自動獲得による製品発表プレスリリースからの製品特徴の抽出2011

    • Author(s)
      酒井浩之
    • Organizer
      言語処理学会第17回年次大会発表論文集
    • Place of Presentation
      豊橋技術科学大学(愛知県)
    • Year and Date
      2011-03-09
  • [Presentation] Automatic Comma Insertion for Japanese Text Generation2010

    • Author(s)
      Masaki Murata
    • Organizer
      EMNLP-2010
    • Place of Presentation
      米国
    • Year and Date
      2010-10-10
  • [Presentation] Translation Unit for Simultaneous Japanese-English Spoken Dialogue Translation2010

    • Author(s)
      Koichiro Ryu
    • Organizer
      IDT-2010
    • Place of Presentation
      米国
    • Year and Date
      2010-07-30
  • [Presentation] Correcting Errors in a Treebank Based on Synchronous Tree Substitution Grammar2010

    • Author(s)
      Yoshihide Kato
    • Organizer
      ACL-2010
    • Place of Presentation
      スウェーデン
    • Year and Date
      2010-07-12
  • [Presentation] Construction of Chunk-Aligned Bilingual Lecture Corpus for Simultaneous Machine Translation2010

    • Author(s)
      Masaki Murata
    • Organizer
      LREC-2010
    • Place of Presentation
      マルタ共和国
    • Year and Date
      2010-05-20
  • [Book] Computer Processing of Asian Spoken Languages2010

    • Author(s)
      Shuichi Itahashi
    • Total Pages
      372
    • Publisher
      c/o The Americas Group
  • [Remarks]

    • URL

      http://slp.itc.nagoya-u.ac.jp/~matubara/kaken/si/

URL: 

Published: 2012-07-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi