• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2008 Fiscal Year Annual Research Report

入力文の分割・翻訳・連結による同時通訳システム

Research Project

Project/Area Number 20300058
Research InstitutionToyohashi University of Technology

Principal Investigator

稲垣 康善  Toyohashi University of Technology, 工学部, 理事・副学長 (10023079)

Co-Investigator(Kenkyū-buntansha) 松原 茂樹  名古屋大学, 情報連携基盤センター, 准教授 (20303589)
加藤 芳秀  名古屋大学, 大学院・国際開発研究科, 助教 (20362220)
笠 浩一朗  名古屋大学, 情報連携基盤センター, 研究員 (40397451)
大野 誠寛  名古屋大学, 大学院・国際開発研究科, 助教 (20402472)
酒井 浩之  豊橋技術科学大学, 工学部, 助教 (70402659)
Keywords機械翻訳 / 同時通訳 / 音声言語処理 / 音声ドキュメント / 対話処理 / 文分割 / コーパス / 構文構造
Research Abstract

本研究では、同時通訳機能を備えた音声翻訳システムの新しい翻訳方式として、入力文を適切な翻訳単位に分割し、各々の単位に対応する訳文を作成し、それらをうまくつなげながら翻訳結果を生成するという、「分割・翻訳・連結による同時翻訳方式」の実現を目的とする。このために初年度は、以下の研究項目を推進し、いくつかの成果を得ることができた。
1. 対訳対応つき音声言語コーパスの構築:音声データの同時翻訳単位への分割、及び、単位ごとに対訳対応が与えられたコーパスを作成した。作成は、名古屋大学同時通訳データベースに対して注釈を与えることにより実施した。すなわち、全16講演に含まれるすべての文に対して、それを意味的単位に人手で分割し、各単位に同時通訳に適した形式で訳文を付与した。これは本研究を推進する上での基盤データとして使用される。
2. 音声言語コーパスの分析とその応用:コーパスの分析により同時翻訳単位の音響的特徴(速度、ポーズなど)、言語的特徴(構文構造、節境界など)を明らかにした。これらのデータを用いて以下に示す研究内容を実施した。
(1) 講演文の意味単位への分割手法を構築した。抽出した特徴を考慮した機械学習手法を考案し、適切な長さへの分割を約80%の精度で実現できることを確認した。
(2) 対話文の翻訳単位としての基本的性質とその分割技術を開発した。節境界タイプを考慮することにより、同時性を満たす単位境界検出において78%の精度に達することを明らかにした。

  • Research Products

    (9 results)

All 2009 2008 Other

All Journal Article (4 results) (of which Peer Reviewed: 4 results) Presentation (4 results) Remarks (1 results)

  • [Journal Article] 依存構造に基づく用例文検索手法とその評価2009

    • Author(s)
      加藤芳秀
    • Journal Title

      電子情報通信学会論文誌 J92-D(3)

      Pages: 417-427

    • Peer Reviewed
  • [Journal Article] 節の始境界検出に基づく独話文の係り受け解析2009

    • Author(s)
      大野誠寛
    • Journal Title

      情報処理学会論文誌 50(2)

      Pages: 553-562

    • Peer Reviewed
  • [Journal Article] 同時通訳の工学と科学-次世代自動通訳技術の実現に向けて2008

    • Author(s)
      松原茂樹
    • Journal Title

      情報処理 49(6)

      Pages: 19-25

    • Peer Reviewed
  • [Journal Article] Cause Information Extraction from Financial Articles Concerning Business Performance2008

    • Author(s)
      酒井浩之
    • Journal Title

      IEICE Trans, on Information and Systems E91-D(4)

      Pages: 959-968

    • Peer Reviewed
  • [Presentation] 対訳コーパスを用いた同時翻訳単位の検出2009

    • Author(s)
      笠浩一朗
    • Organizer
      言語処理学会
    • Place of Presentation
      鳥取大学
    • Year and Date
      2009-03-05
  • [Presentation] Polarity Assignment to Causal Information Extracted from Financial Articles Concerning Business Performance of Companies2008

    • Author(s)
      酒井浩之
    • Organizer
      AI-2008
    • Place of Presentation
      ケンブリッジ(英国)
    • Year and Date
      2008-12-11
  • [Presentation] English Sentence Retrieval System Based on Dependency Structure and its Evaluation2008

    • Author(s)
      加藤芳秀
    • Organizer
      IEEE ICDIM-2008
    • Place of Presentation
      ロンドン(英国)
    • Year and Date
      2008-11-14
  • [Presentation] Dependency Parsing of Japanese Spoken Monologue Based on Clause-Starts Detection2008

    • Author(s)
      大野誠寛
    • Organizer
      INTERSPEECH-2008
    • Place of Presentation
      ブリスベン(豪国)
    • Year and Date
      2008-09-26
  • [Remarks]

    • URL

      http://www,el.itc.nagoya-u.ac,jp/~matubara/Kaken/si/

URL: 

Published: 2010-06-11   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi