2009 Fiscal Year Annual Research Report
Project/Area Number |
20300058
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
稲垣 康善 Toyohashi University of Technology, 工学部, 理事 (10023079)
|
Co-Investigator(Kenkyū-buntansha) |
松原 茂樹 国立大学法人名古屋大学, 情報基盤センター, 准教授 (20303589)
加藤 芳秀 国立大学法人名古屋大学, 情報基盤センター, 研究員 (20362220)
笠 浩一朗 国立大学法人名古屋大学, 大学院・国際開発研究科, 助教 (40397451)
大野 誠寛 国立大学法人名古屋大学, 大学院・国際開発研究科, 助教 (20402472)
酒井 浩之 豊橋技術科学大学, 工学部, 助教 (70402659)
|
Keywords | 機械翻訳 / 同時通訳 / 音声言語処理 / 音声ドキュメント / 対話システム / 文分割 / コーパス / 係り受け構造 |
Research Abstract |
本研究では、同時通訳機能を備えた音声翻訳システムの新しい翻訳方式として、入力文を適切な単位に分割し、各々の単位に対応する訳文を作成し、それらをうまくつなげながら翻訳結果を生成するという「分割・翻訳・連結による同時翻訳方式」の実現を目的とする。今年度は、初年度に構築した対訳対応付き音声言語コーパスを基盤に、以下の研究項目を推進し、いくつかの成果を得ることができた。 1.音声言語文の単位分割手法の開発:講演の翻訳の同時性を高めることを目的に、日本語講演テキストの単位分割手法を開発した。23,598文節規模の日本語講演データに対して、形態素、文節、節、及び、係り受け構造などの言語タグを与え、それに対して改行挿入実験を実施した。実験には同時通訳コーパスを使用した。ベースラインと比較し、大幅に性能が向上しており、本手法の効果を確認することができた 2.翻訳単位間の意味関係の推定手法の開発:翻訳単位間の意味的関係に基づいて対訳表現を適切に連結することを目的に、接続助詞「が」のあいまい性を解消する手法を開発した。本手法では、入力として接続助詞「が」を含む文を入力し、その意味関係が「逆接」であるか「逆接以外」であるかを推定する。本研究では、新聞記事コーパスから大量の学習データを自動的に作成することを可能にした。推定実験の結果、正解率75.0%を達成した。 3.同時的な文構造解析技術の開発:音声言語文をその入力と同時的に解析するための高精度な手法を開発した。本手法では、接合操作に基づくアプローチを採用することにより、左再帰構造に起因する局所的曖昧性の問題を回避する。単語間の依存関係に注目し、依存関係の一貫性が保たれるような操作のみを許容することにより、下降型解析に基づく従来の解析手法と比べてより高精度な解析が実現できることを実験により確認した。
|
Research Products
(8 results)