研究課題/領域番号 |
26280082
|
研究機関 | 名古屋大学 |
研究代表者 |
松原 茂樹 名古屋大学, 情報科学研究科, 准教授 (20303589)
|
研究分担者 |
加藤 芳秀 名古屋大学, 情報連携統括本部, 准教授 (20362220)
大野 誠寛 名古屋大学, 情報基盤センター, 助教 (20402472)
村田 匡輝 豊田工業高等専門学校, 情報工学科, 助教 (30707807)
笠 浩一朗 名古屋大学, 国際開発研究科, 助教 (40397451)
|
研究期間 (年度) |
2014-04-01 – 2019-03-31
|
キーワード | 自然言語処理 / 音声言語処理 / 機械翻訳 / 構文解析 / 意味解析 / 言語生成 / コーパス / 構文木 |
研究実績の概要 |
本研究では、通訳者の訳出方略を活用した講演の同時通訳技術を実現することを目的し、講演音声を逐次的に解析する技術、及び、同時通訳の実行に有用な知識や技法を発見・活用する方法を開発することを目指す。そのために初年度は特に、文の逐次的な解析に関する技術の研究開発を進めた。具体的には以下の項目の研究を推進した。 1.日本語の逐次解析技術として、講演音声に対して同時進行的に入力を解析し、構文構造を出力する手法を考案した。この手法では、文節が入力されるごとに解析を実行し、既入力の文節間の依存関係、並びに、係り先が未入力の文節に対しては既入力の文節との非依存性を同定し、それを明示した係り受け構造を生成する。手法の特長は、係り先が未だ入力されていないという情報を解析器が提示する点にあり、これにより、システムは文節列の構文的なまとまりの成否をより考慮した処理が可能となるという利点がある。同時通訳データベースを用いた係り受け解析実験により、本手法が漸進的な係り受け解析を高精度で実行できることを示すに至っている。 2.英語の逐次解析技術として、解析における非局所的な依存関係を同定する手法を考案した。この手法では、構文木上の任意の位置に空要素を挿入することにより、空要素を含む部分的な構文木を生成する。また、空要素とそのフィラーとの対応を同定するために、スラッシュ素性注釈とヒューリスティック規則のハイブリッドなアプローチを採用しており、これにより、逐次的な解析における局所的曖昧性を減らすことを可能にしている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
今年度は、プロジェクトの初年度として、同時通訳の研究資源について検討するとともに、同時通訳を音声・言語の観点から定量的分析を開始している。また、同時通訳の要素技術として、講演音声を逐次的に解析する機構を実現し、係り先が未入力の文節に対する解析を提示する仕組みを開発するに至っている。同時通訳データベースを用いた解析実験でも良好な結果を示しており、本課題はおおむね順調に進展しているといえる。
|
今後の研究の推進方策 |
次年度以降は、研究資源の更なる整備として、同時通訳データベースの拡張を進める。また、拡張したデータの音声・言語的分析を通して同時通訳に特有の通訳知識を獲得を目指す。一方で、同時通訳の要素技術として講演の意味解析及び訳文の逐次的生成に焦点を当てた研究への展開を予定している。 現状において、研究を遂行する上での問題点などは発生しておらず、研究計画の大きな変更を要する状況にはない。
|
次年度使用額が生じた理由 |
初年度は、講演音声の同時通訳機構の実現を目指し、本研究で必要となる通訳研究資源の整備を進める予定であった。同時通訳データに対する構文・意味タグの設計について検討を進めたものの、仕様の策定については、逐次的な解析のアルゴリズムを考慮して与える必要があるとの結論に至った。このため、次年度に開始する予定であった同時通訳のための基礎技術に関する研究を並行して進めるように計画を変更した。通訳研究資源の整備におけるタグ付け作業は次年度に実施することとしたため、次年度使用額が生じた。
|
次年度使用額の使用計画 |
次年度は、通訳研究資源の整備を進めるとともに、通訳データ分析及び文の逐次解析・生成の基礎技術に関する研究を推進する。研究費については、通訳研究資源の整備における構文・意味タグ付けの委託、通訳データ分析のための作業、解析・生成処理に使用する計算機購入、及び、成果発表旅費に使用することを計画している。
|