2014 Fiscal Year Research-status Report
多角的な観点に基づく同時通訳者の通訳プロセスの定量的な分析
Project/Area Number |
25770146
|
Research Institution | Nagoya University |
Principal Investigator |
笠 浩一朗 名古屋大学, 国際開発研究科, 助教 (40397451)
|
Project Period (FY) |
2013-04-01 – 2017-03-31
|
Keywords | 自然言語処理 / 機械翻訳 |
Outline of Annual Research Achievements |
平成26年度は、同時通訳データベースの「日英通訳データの講演データ」に対して、高度なアノテーション情報として、「単語・音素単位の時間情報」と「高度な言語情報」を付与した。 「単語・音素単位の時間情報」の付与では、これまでの同時通訳データベースには、単語単位で開始と終了時間が付与されているため、それをもとに音素単位で時間情報を付与した。具体的には、音声データの書き起こしテキストに対して、単語の読みを付与し、さらに読みから音素を付与したデータを作成する。その音素データと音声波形データを用いて単語・音素セグメンテーションツールにより、単語・音素単位での時間情報の付与を実施した。 高度な言語情報の付与では、日本語データは依存構造解析器、節境界解析器を用いて言語情報付与した。一方、英語データは、依存構造解析器と構文構造解析器を用いて付与した。 分析に関しては、平成25年度に作成した「英日通訳データの講演データ」の高度なアノテーション情報を利用して、同時通訳者のタイプ分類などの研究を進めている。また、同時通訳者の記憶に蓄積している記憶量の状況が同時通訳者の訳出にどのような影響を与えるかについても、分析を進めている。 今後は、どのようなタイミングが訳出開始のトリガーとなっているのかを、高度な時間情報と言語情報をもとに、分析を進めていくことを予定している。また、英日と日英の訳出方向の違いに関する研究も進めていく予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
「日英講演データ」へのアノテーション作業と昨年度作成した「英日講演データ」のアノテーション情報を用いた分析を並行して実施しているため、「日英講演データ」の分析については、まだ十分に行えていない状況である。
|
Strategy for Future Research Activity |
今後の方針としては、昨年度実施予定だった「日英講演データ」の分析、及び、「英日」と「日英」の通訳方向の違いに関する研究を速やかに実施する予定である。 今年度実施予定の「英日対話データ」のアノテーションと分析については、アノテーションの効率化を図ることで、速やかに実施し、研究計画からの遅れを取り戻す予定である。
|
Causes of Carryover |
「日英講演データ」に関する分析研究が十分に実施できなかったため、国内外での学会発表ができなかったことが、一つの原因である。また、アノテーションの付与作業を、研究者自身が実施することで、人件費がかからなかったことがもう一つの原因である。その一方で、アノテーション作業の時間がかかり、分析研究の時間が十分に取れなかった。
|
Expenditure Plan for Carryover Budget |
今年度からは、一部のアノテーション作業を所属する大学の学生に実施させることで、アノテーション作業の効率化をはかり、分析研究に重点をあてて進めていく予定である。
|