2012 Fiscal Year Annual Research Report
外国語ニュース・講演の音声同時通訳方式に関する研究
Project/Area Number |
24240032
|
Research Category |
Grant-in-Aid for Scientific Research (A)
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
中村 哲 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (30263429)
|
Co-Investigator(Kenkyū-buntansha) |
松本 裕治 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)
戸田 智基 奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90403328)
小町 守 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (60581329)
サクリアニ サクティ 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (00395005)
NEUBIG Graham 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (70633428)
DUH Kevin 奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80637322)
|
Project Period (FY) |
2012-05-31 – 2017-03-31
|
Keywords | 同時通訳 / 音声翻訳 / 音声認識 / 機械翻訳 |
Research Abstract |
本研究では、英語を対象に、中級程度の通訳者と同等の同時通訳性能の実現を目標とし、コーパス構築、同時通訳方式の確立、システム構築、実証実験を進める。 【同時通訳基本方式の研究】 本年度は,同時通訳を実現するため,音声翻訳システムの遅延の原因として考えられる機械翻訳モジュールを,同時処理化する手法の基礎検討を行った.具体的にはフレーズベース機械翻訳のフレーズテーブルを用いて,翻訳単位を短くする方法を提案した.まず,原言語のフレーズパターンを利用することで,翻訳単位を決定する.さらに,翻訳単位が短くなりすぎて翻訳精度が劣化することを防ぐために,両言語の語順が同等である確率(right 確率) を利用して、翻訳単位の長さの調整を行う新しい手法を提案した.提案法における翻訳の精度と同時性への影響を調査するために,旅行対話のデータを利用し翻訳単位の長さと翻訳精度の関係を検証し,フレーズテーブルとright 確率を用いた翻訳単位の決定方法により,翻訳開始および翻訳処理の時間を減少できることを確認した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
同時通訳の基本的な方法を提案した.この同時通訳法の改良,および,この方法に合わせて音声認識,音声合成を五月雨に制御できれば,同時通訳のプロトタイプが実現できる.また,熟練度3レベルの同時通訳者コーパスに対し,プロトタイプの性能を比較することにより,同時通訳システムのコミュニケーション評価の研究が行える.これらのことから,本研究は順調に進展していると考えられる.
|
Strategy for Future Research Activity |
【同時通訳基本方研究】平成24年度の研究の高度化に加えて、全体として音声同時通訳として許容できる時間遅れで出力できるよう最適化する研究、さらに、声質や韻律情報、話し言葉表現、文脈に応じた省略の癖などの個人音声言語情報を音声認識、音声合成において利用する方法、講演・ニュース、および、講演に関する事前の関連資料、発話原稿、Webから検索した内容に関連した情報を利用することでトピック(内容)に適合した言語モデルを作成し音声同時通訳を高精度化する研究を行う. また,同時通訳方式については,平成24年度の成果に加えて、文脈・大域的情報の利用として、発話文系列からの適応的、かつ、高精度な状況依存の言語理解の研究、意味解析や談話解析といった1文を超えた言語処理の研究成果を応用した対話の結束性分析に取り組む。評価については,主観評価に加えて同時通訳者およびシステムの訳出に対し、翻訳品質、および、タイミングの精度を、リアルタイムで違和感を測定する手法の研究を試みる。 【ニュース・講演同時通訳コーパス,プロトタイプ構築】平成24年度のコーパスに加えて、英語の講演としてTEDのサイトから残り15時間、ネットで公開されているニュースから5時間、日本語の講演としてCSJプロジェクトで収集された講演音声から残り15時間、公開されているニュース合計5時間を選択し、上級(S), 中級(A)、初級(B)の同時通訳者による同時通訳を付与し、これらの手動書き起こし、チャンクの付与を行う。外国語ニュース・講演の音声同時通訳のプロトタイプシステムの全体概念設計、詳細設計を行い、平成26年度にシステムを構築、平成27年度に評価改良、平成28年度に最終プロトタイプとする。
|
Research Products
(10 results)