2016 Fiscal Year Annual Research Report
通訳方略の体系化と文構造の逐次解析に基づく講演音声の同時通訳
Project/Area Number |
26280082
|
Research Institution | Nagoya University |
Principal Investigator |
松原 茂樹 名古屋大学, 情報科学研究科, 准教授 (20303589)
|
Co-Investigator(Kenkyū-buntansha) |
加藤 芳秀 名古屋大学, 情報連携統括本部, 准教授 (20362220)
大野 誠寛 名古屋大学, 情報基盤センター, 助教 (20402472)
村田 匡輝 豊田工業高等専門学校, 情報工学科, 助教 (30707807)
笠 浩一朗 三重短期大学, 生活科学科, 准教授 (40397451)
|
Project Period (FY) |
2014-04-01 – 2019-03-31
|
Keywords | 自然言語処理 / 音声言語処理 / 機械翻訳 / 構文解析 / 意味解析 / 言語生成 / コーパス / 構文木 |
Outline of Annual Research Achievements |
本研究では、講演の同時通訳機構を実現することを目的とし、講演音声を逐次的に解析・生成する技術、及び、同時通訳の実行に有用な知識を発見・活用する方法を開発することを目指す。そのために今年度は、文の逐次的な意味解析技術、及び、生成する訳文の語順整序法に関する研究開発を進めた。具体的には以下の項目の研究を推進した。 1)文を入力された順に先頭から読み込み、読み込んだ文の断片に対して意味表示を割り当てる逐次的な意味解析技術を開発した。本技術は、組合せ範疇文法の枠組みを利用して意味表示を構成するものであり、組合せ範疇文法における導出を構文木とみなすことにより、導出を表現する構文木を漸進的構文解析により生成する。解析過程で生成される部分構文木は、導出の一部を表現するため、この部分構文木から意味表示を合成する方法を組合せ範疇文法に沿って定義した。この方式は、組合せ範疇文法による意味合成にのみ依存しているため、それに基づく意味解析を流用することで、漸進的な意味解析が実現できる。 2)通訳機構によって生成される読みにくい語順の日本語文に対して、読みやすい語順となるように文節を並べ替える技術を開発した。本手法は、係り受け構造が付与されていない文を入力とし、係り受け解析と語順整序を同時に行う。係り受けと語順の適切さを同時に考慮することにより、読みやすい語順に精度よく整えることができる。評価実験では、文法的には間違っていないものの読みにくい語順をもつ文を擬似的に作成し、それらに対して語順整序を実行した。元の文の語順を正解としたときの、語順整序結果との一致を測定した結果、本手法による語順整序結果は、比較のために設定した二つのベースラインと比べ高い正解率を達成しており、本手法の有効性を確認した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
プロジェクトの3年目として、講演音声の逐次的な構文・意味解析の機構の開発を進めた。また、訳文の生成技法について効果的な方式を実現するに至っており、論文としてまとめ公表するなど、本課題はおおむね順調に進展しているといえる。
|
Strategy for Future Research Activity |
次年度以降は、これまでに整備した同時通訳コーパスを活用した研究を展開する。通訳方略の獲得と分類、及び、それを活用した訳出方式の開発など、要素技術の統合化に関わる項目を重点的に進める。 現状において、研究を遂行する上での致命的な問題等は生じておらず、研究計画の大幅な変更を要する状況にはない。
|
Causes of Carryover |
今年度は、通訳方略の分類と体系化、及びパターン化のために同時通訳コーパスに対訳対応に関するアノテーションを与えることで質的に拡張する予定であった。通訳方略の獲得と体系化について既存のコーパスを用いて進めたものの、パターン化については次年度に取り組むとの判断に至り、一部計画を変更した。このため、上述のコーパス拡張を次年度に実施することとしたため、次年度使用額が生じた。
|
Expenditure Plan for Carryover Budget |
次年度は、通訳方略のパターン化を進めるとともに、逐次的な翻訳機構の開発を進める。研究費については、方略のパターン化の基盤となるコーパス拡張、逐次的な翻訳処理のための計算環境の整備、及び、成果発表に使用することを計画している。
|
Research Products
(6 results)