近年、国内における国際会議などの開催が増えており同時通訳の需要は大きいものの、同時通訳者の養成は容易ではなく、通訳の自動化が期待されている。本研究では、英語講演の自動通訳を実現するための話し言葉翻訳処理技術の開発を目的とする。今年度はそのための基礎的研究を実施した。具体的には以下の項目の研究を行った。 (1)英語講演通訳コーパスの構築とその分析 10数分程度の英語講演の音声と同時通訳の日本語音声を収録した。講演は、英語ネイティブ話者が学会講演調で模擬的に行い、同時通訳者がそれを通訳した。収録音声の文字化は、話し言葉を特徴付ける談話タグのほか、各発話の発声時間情報も付与している。全体で36時間程度の音声を収録した。作成したコーパスの定量的分析を通して講演通訳の言語的特性を明らかにした。 (2)同時通訳の処理単位と生成タイミングに関する検討 同時通訳における話し言葉処理の言語的単位、並びに通訳結果の発声タイミングについて調査した。まず、講演通訳コーパスに付与された時間データをもとに、話者と通訳者との発話対応付けを実施した。その上で、対訳語と発話開始時間、及び、発話時間長に基づく自動対訳対応付け手法を考案し、コーパスをテストデータとして実験を行い、その有効性を評価した。次に、対応付けデータをもとにプ□の通訳者の通訳単位を抽出した。その結果、構文的な特性だけを考慮して、通訳開始タイミングを決定できる場合が存在することを確認した。
|