研究課題/領域番号 |
26280082
|
研究機関 | 名古屋大学 |
研究代表者 |
松原 茂樹 名古屋大学, 情報科学研究科, 准教授 (20303589)
|
研究分担者 |
加藤 芳秀 名古屋大学, 情報連携統括本部, 准教授 (20362220)
大野 誠寛 名古屋大学, 情報基盤センター, 助教 (20402472)
笠 浩一朗 三重短期大学, 生活科学科, 准教授 (40397451)
村田 匡輝 豊田工業高等専門学校, 情報工学科, 助教 (30707807)
|
研究期間 (年度) |
2014-04-01 – 2019-03-31
|
キーワード | 自然言語処理 / 音声言語処理 / 機械翻訳 / 構文解析 / 意味解析 / 言語生成 / コーパス / 構文木 |
研究実績の概要 |
本研究では、通訳者の訳出方略を活用した講演の同時通訳技術を実現することを目的とし、講演音声を逐次的に解析・生成する技術、及び、同時通訳の実行に有用な知識を発見・活用する方法を開発することを目指す。そのために今年度は、文の逐次理解のための構文データの構築、及び、通訳者のタイプ分類に関する研究開発を進めた。具体的には以下の項目の研究を推進した。 1.逐次的な日本語係り受け解析の性能向上を目指し、人間による言語処理過程を表出した大規模データを構築した。構築したデータは、2,502 文を対象に、文節が文頭から順に1つ提示されるたびに、人間が係り受け構造を解析し、その解析結果をタグ付けしている点に特徴がある。文の係り受け構造の逐次解析の観点から、人間の言語処理過程を大規模に調査した研究はほとんどなく、解析能力や振舞いから有用な知見を得ることができれば、逐次的な係り受け解析の性能向上につながる可能性がある。構築したデータに定量的な分析を施し、人間の解析能力と予測能力の一端を明らかにした。 2.同時通訳者には、保有する通訳方略に応じていくつかのタイプに分けられる。本研究では、同時通訳の訳出に表出する多数の特徴量をもとに、統計的な手法で通訳者をタイプ分類する方法を開発した。具体的には、主成分分析とクラスタリング手法を適用することで、同時通訳者を通訳タイプに分類する。主成分分析により、特徴量を合成指標に圧縮し、通訳者をクラスタリング手法によりタイプ分類する。同時通訳者の特徴が表出する特徴量としては、訳出率、訳出遅延時間、訳文の長さ、発話速度、発話率、ポーズの平均長、フィラーの頻度などを採用した。英日同時通訳者の分類実験を実施し、同時通訳コーパスに収録された講演通訳データを用いて、同時通訳者の分類を試みた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
プロジェクトの2年目として、初年度で構築した同時通訳の研究資源を対訳対応に関して拡張するとともに、講演音声の逐次的な構文解析の機構の開発を進めた。さらに、同時通訳において理解しやすい文を出力するための基盤技術として、文の整序のための仕組みを作り上げるに至っている。加えて、同時通訳方略の獲得に向けた通訳のタイプ分類において進捗があり、本課題はおおむね順調に進展しているといえる。
|
今後の研究の推進方策 |
次年度以降は、今年度までに拡張したコーパスに基づき研究を推進する。具体的には、通訳方略の体系化、及び、逐次的な構文・意味解析システムなど、講演の同時通訳を実現するための中心的な基盤となる項目を重点的に進める。一方で、訳出のタイミングに焦点を当てた計測・評価技術の開発への展開を予定している。 現状において、研究を遂行する上での問題点などは発生しておらず、研究計画の大きな変更を要する状況にはない。
|
次年度使用額が生じた理由 |
今年度は、講演の同時通訳の実現に向けた計算資源として、逐次解析・翻訳プログラム開発用の高性能計算環境を整える予定であった。逐次的な解析機構の設計と評価については今年度に実施したものの、構文・意味の逐次解析における大規模データを使用した実験については、次年度に実施するとの判断に至り、一部計画を変更した。このため、上述の計算資源の整備を次年度に実施することとしたため、次年度使用額が生じた。
|
次年度使用額の使用計画 |
次年度は、通訳方略の体系化を進めるとともに、逐次的な解析・生成技術に関する研究を推進する。研究費については主に、方略の体系化のための通訳研究資源の構築、解析・生成の大規模実験のための計算環境の整備、及び、成果発表に使用することを計画している。
|