研究概要 |
JECPRESE(The Japanese-English Corpus of Presentations in Science and Engineering)検索サイトを構築し,H21年度の公開時には口頭発表(以降,発表)の各文章を32種類のmove(表現意図)に分類していた.Move数は多く,整理しにくいことは課題であった. 新規に米国の大学にて収録した工学部学生による発表は,既存の日本語発表と類似であり,H22年度にそれらを中心に解析して下記のとおりmoveのリストを更新した. 1.日英語による発表の各文章を,まず2階層のmoveに分類することにした. 2.第1階層は発表全体を構成する7種類のSections:Start,Introduction,Materials and Methods,Results and Discussion,Conclusion,EndingおよびQuestions and Answers. 3.第2階層は各Section内にある詳細な12種類のStepsとした:Acknowledgements,Audience orientation,Background,Description,Evaluation,Explanation,Further research,Gap,Implication,Overview,ProcedureおよびPresent work. 以前の32movesでは,例えば方法説明時に生起した「実験手順」は結果説明時に生起した「実験手順」は異なった2種類のmoveに分類されていたが,新分類方法では「手順」は発表内のどの部分に生起してもProcedureとして分類することにした. 今後は各文章にこれらのSection/Stepをタグ付ける作業を行い,更新したコーパスを公開する.
|