研究概要 |
英語日本語間双方向同時通訳システムの実現を目指し、本年度は、平成11年度に作成した同時通訳コーパスを活用して漸進的な音声翻訳手法の計算機上への実現に関する研究を実施した。また、プロトタイプシステムを用いた翻訳実験を通してその評価を試みた。具体的には、次の1.〜4.の項目の研究を実施した。 1.日本語話し言葉の頑健な構文解析手法の提案 日本語対話音声の連続音声認識ソフトウェアを用いて認識した結果をロバストに解析する手法を提案した。係り受け分析が付与されたデータから獲得した統計情報を活用することにより、文節間係り受け関係を付与することができる。対話コーパス上での解析実験を通してその利用可能性を確認した。 2.漸進的文生成に基づく日英話し言葉翻訳手法の開発 日本語動詞の早期予測可能性について検討するとともに、語順の入れ換えや態の変換を活用した漸進的英語文生成手法を開発した。日本語文の文末に出現する表現が、英語では早い段階で訳出されるという日英間の構造上の違いを一部解消可能となった。 3.プロトタイプシステムの実現 プロトタイプシステムは、解析部、変換部、生成部、予測部から構成される。予測部は、EDR単語概念辞書とATR対話コーパスの共起データをもとに英語動詞を推定する。共起データは概念化した名詞句と動詞との共起関係をもとに、1,883個の規則として作成した。システムは、日本語語彙540語程度の規模で、ワークステーション上に実装した。 4.翻訳実験によるシステムの評価 ATR対話データベースに収録された旅行申し込みをタスクとする4対話をテストセットとして用いた動詞予測実験の結果、53%の精度が得られた。さらに、文翻訳正解率に関する実験により、本研究で開発した生成手法の有効性を確認した。
|