研究課題/領域番号 |
26280082
|
研究機関 | 名古屋大学 |
研究代表者 |
松原 茂樹 名古屋大学, 情報連携統括本部, 教授 (20303589)
|
研究分担者 |
加藤 芳秀 名古屋大学, 情報連携統括本部, 准教授 (20362220)
大野 誠寛 東京電機大学, 未来科学部, 准教授 (20402472)
村田 匡輝 豊田工業高等専門学校, 情報工学科, 助教 (30707807)
笠 浩一朗 三重短期大学, 生活科学科, 准教授 (40397451)
|
研究期間 (年度) |
2014-04-01 – 2019-03-31
|
キーワード | 自然言語処理 / 音声言語処理 / 機械翻訳 / 構文解析 / 意味解析 / 言語生成 / コーパス / 構文木 |
研究実績の概要 |
本研究では、講演音声の同時通訳のための機構の実現することを目指し、講演音声を逐次的に解析・生成する技術、ならびに、同時通訳の遂行で活用される同時通訳者の技術を蓄積することを目的としている。今年度は、同時通訳のための逐次理解技術、および、同時通訳における欠落に注目して研究を実施した。具体的には以下の項目の研究を推進した。 1)逐次的な意味解析に関する研究は、文の断片に対する意味表現の構成法をその中心課題としており、構成された意味表現の解釈法の整備は十分でない。形式意味論では、文に対して命題的な解釈を与えることが一般的であるのに対し、本研究では、モデル理論的意味論に基づき文の断片に対する意味表現を解釈する一つの試みとして、談話表示理論の意味論を拡張した漸進的な意味解釈を実現した。文の断片に対する部分談話表示構造の解釈を、割当の更新を規定する二つの集合、すなわち、談話表示構造が定める更新の下限と上限の対として定義した。これは、漸進的に意味解釈がなされる過程を情報の単調性として説明できるとともに、文に対する談話表示構造の解釈との整合性が保たれているといった性質を備える。 2)同時通訳で訳出困難な場面を自動的に検出することは、通訳者の処理及び記憶に掛かる負担の軽減に利用できる。本研究では、訳出困難な箇所を特定する手がかりとして、訳出の失敗の現象の一つである語の欠落に注目した。具体的には、同時通訳における「原発話及び通訳状況の特徴」と「語の欠落の発生」との関係を解明することを目指し定量的な分析を与えた。分析では、同時通訳データベースの英日同時通訳データを使用し、語の欠落を分析するために、単語レベルでの対訳対応データを利用した。分析により、語の欠落と、講演者の話速、内容語の品詞、文の構文構造、訳出の遅延時間との関係を明らかにした。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究課題では、講演の同時通訳のための通訳方略の解明と逐次解析技術の開発を目的としており、今年度は、同時通訳データベースを用いた現象の体系的分析と逐次的な構文・意味解析技術の実現に至った。成果を学術論文として公表するに至っており、本研究はおおむね順調に進展しているといえる。
|
今後の研究の推進方策 |
次年度は最終年度として、同時通訳の方略をデータに基づき体系的にとりまとめる一方で、講演の同時通訳のための逐次的な文解析と文生成の方式の統合化を重点的に進める。現状では、研究を遂行する上での重要な問題は発生しておらず、計画の大幅な変更を要する状況にはない。
|
次年度使用額が生じた理由 |
今年度は、通訳方略の分類と体系化に向けて、そのための注釈付け作業を実施する予定であった。検討を進めたものの統一的な基準に基づく注釈付けの困難性が明らかになったため、通訳の評価データを用いた体系化アプローチを採用が望ましいとの結論に至り、計画を一部変更した。このため、評価データ付与作業を次年度に実施することとしたため、次年度使用額が生じた。次年度は、通訳データの拡張を進めるとともに、逐次的な解析・変換・生成の評価実験を進める予定であり、そのための計算環境整備、及び、成果発表旅費として使用する計画である。
|