研究課題/領域番号 |
20300058
|
研究機関 | 豊橋技術科学大学 |
研究代表者 |
稲垣 康善 豊橋技術科学大学, 大学院・工学研究科, 理事 (10023079)
|
研究分担者 |
松原 茂樹 国立大学法人名古屋大学, 情報科学研究科, 准教授 (20303589)
加藤 芳秀 国立大学法人名古屋大学, 情報基盤センター, 研究員 (20362220)
笠 浩一朗 国立大学法人名古屋大学, 大学院・国際開発研究科, 助教 (40397451)
大野 誠寛 国立大学法人名古屋大学, 大学院・国際開発研究科, 助教 (20402472)
酒井 浩之 豊橋技術科学大学, 大学院・工学研究科, 助教 (70402659)
|
キーワード | 同時通訳 / 機械翻訳 / コーパス / 文分割 / 音声言語 / 機械学習 / 翻訳単位 / システム評価 |
研究概要 |
最終年度として、これまでに構築した言語基盤ならびに要素技術をもとに、入力文の分割、翻訳、連結に基づく同時通訳機能の実現に関する研究を推進した。 1.同時通訳機能の設計:同時通訳プロセスの基本設計を与えた。システムを構成するモジュールとして「解析」「分割」「翻訳」及び「連結」を設定し、それぞれの機能を明確化した。設計にあたっては、処理の精度に加え、通訳タイミングを重視して設計した。さらに、これらの設計を既存の同時通訳コーパスの構成に反映し、コーパスへのアノテーションの拡張を実施した。 2.同時通訳の要素技術の高性能化:これまでに開発した以下の要素技術について整備し、同時通訳機能を実現するための高性能化を推進した。 (A)入力文の解析技術:文の入力と同時進行的に解析を実行する技術を開発した。実験により、本手法が通常の文単位の構文解析システムと同程度の精度を有し、かつ、リアルタイムに実行できる解析性能を有していることを確認した。 (B)入力文の分割技術:講演文及び対話文を対象に、係り受け関係、節境界の位置・種類、ポーズ長など、分割位置に関連する要因をパラメータとする確率モデルを実装した。開発用データを用いて分割実験を繰り返し、分割に最適なパラメータとその組み合わせを決定した。 (C)分割された単位間の関係検出技術:単位間の関係を、連体修飾、主題-述語などの文法的側面から定め、それを係り受け構造を考慮して自動的に検出する確率モデルを実現した。同時通訳コーパスを用いた実験によって高い検出性能を備えていることを明らかにした 同時通訳機能を実現するために上述の諸技術を統合可能性について検証を与えた。具体的には、旅行をドメインとする対話文、及び、日常トピックを対象とした講演文をターゲットとして選定し、その実現可能性を確認することができた。
|