2005 Fiscal Year Annual Research Report
同時通訳者の訳出プロセスの解明を目指した大規模音声対訳コーパスの定量的分析
Project/Area Number |
17652040
|
Research Institution | Nagoya University |
Principal Investigator |
遠山 仁美 名古屋大学, 大学院・情報科学研究科(工学部), 研究員 (30397450)
|
Co-Investigator(Kenkyū-buntansha) |
松原 茂樹 名古屋大学, 情報連携基盤センター, 助教授 (20303589)
|
Keywords | 同時通訳 / コーパス / 言語分析 / データベース / 対話データ / 通訳単位 / 音声言語 / 言語学 |
Research Abstract |
本研究では、同時通訳者に備わる通訳技能を言語論的に解明することを目的に、同時通訳における訳出の単位(以下、通訳単位)を言語学的な単位(文、節、句など)との比較に基づいて考察した。通訳単位は、訳出の同時性と訳文の品質の双方と密接な関連があり、同時通訳戦略を解明する上で重要ある。初年度は、通訳単位の獲得を目標とし、言語単位分割、対訳対応付け、通訳単位分析の研究を実施した。 (1)言語単位への分割:CIAIR同時通訳データに収録された独話講演の全データ(英日対訳で156千語分、日英通訳で127千語分)に対して、句分割、及び節分割を実施した。分割にはそれぞれ形態素解析器、構文解析器、節境界解析器を支援ツールとして用いた。すでに、話し言葉の構文解析、ならびに、節境界解析に関しては、いずれも90%を超える精度の解析性能を達成しており、これらの技術を活用することにより、低いコストで音声分割を実現することができた。 (2)細粒度の対訳対応付け:通訳データに文よりも細かい粒度での対訳対応を付与した。単語、句、節などのマルチレベルで実施し、最も細かい対訳対を取り出し、その原言語部分を通訳単位として定義した。このような形式化により、通訳単位を、それが発声された段階で訳出できる言語的単位とみなすことができた。対応付けにあたっては、インターネット上での多人数による作業が必要であり、そのような体制を構築し推進した。 (3)通訳単位の分析:上述の(1),(2)の研究により獲得した通訳単位に対して言語学的観点から分析を与えた。まず、各通訳単位に対して言語学的な定義を与え、その定義に基づいて通訳単位を分類し、各通訳単位に対して文法記述を与えることにより分析を推進した。文法は句構造文法の枠組みで記すとともに、統計的手法を用いて通訳単位の言語論的分布を明らかにした。
|