2008 Fiscal Year Annual Research Report
Project/Area Number |
20300058
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
稲垣 康善 Toyohashi University of Technology, 工学部, 理事・副学長 (10023079)
|
Co-Investigator(Kenkyū-buntansha) |
松原 茂樹 名古屋大学, 情報連携基盤センター, 准教授 (20303589)
加藤 芳秀 名古屋大学, 大学院・国際開発研究科, 助教 (20362220)
笠 浩一朗 名古屋大学, 情報連携基盤センター, 研究員 (40397451)
大野 誠寛 名古屋大学, 大学院・国際開発研究科, 助教 (20402472)
酒井 浩之 豊橋技術科学大学, 工学部, 助教 (70402659)
|
Keywords | 機械翻訳 / 同時通訳 / 音声言語処理 / 音声ドキュメント / 対話処理 / 文分割 / コーパス / 構文構造 |
Research Abstract |
本研究では、同時通訳機能を備えた音声翻訳システムの新しい翻訳方式として、入力文を適切な翻訳単位に分割し、各々の単位に対応する訳文を作成し、それらをうまくつなげながら翻訳結果を生成するという、「分割・翻訳・連結による同時翻訳方式」の実現を目的とする。このために初年度は、以下の研究項目を推進し、いくつかの成果を得ることができた。 1. 対訳対応つき音声言語コーパスの構築:音声データの同時翻訳単位への分割、及び、単位ごとに対訳対応が与えられたコーパスを作成した。作成は、名古屋大学同時通訳データベースに対して注釈を与えることにより実施した。すなわち、全16講演に含まれるすべての文に対して、それを意味的単位に人手で分割し、各単位に同時通訳に適した形式で訳文を付与した。これは本研究を推進する上での基盤データとして使用される。 2. 音声言語コーパスの分析とその応用:コーパスの分析により同時翻訳単位の音響的特徴(速度、ポーズなど)、言語的特徴(構文構造、節境界など)を明らかにした。これらのデータを用いて以下に示す研究内容を実施した。 (1) 講演文の意味単位への分割手法を構築した。抽出した特徴を考慮した機械学習手法を考案し、適切な長さへの分割を約80%の精度で実現できることを確認した。 (2) 対話文の翻訳単位としての基本的性質とその分割技術を開発した。節境界タイプを考慮することにより、同時性を満たす単位境界検出において78%の精度に達することを明らかにした。
|
Research Products
(9 results)