研究課題/領域番号 |
18K00678
|
研究機関 | 埼玉大学 |
研究代表者 |
金井 勇人 埼玉大学, 人文社会科学研究科, 教授 (70516319)
|
研究分担者 |
新城 直樹 琉球大学, グローバル教育支援機構, 講師 (90367128)
河 正一 大阪府立大学, 高等教育推進機構, 准教授 (20812150) [辞退]
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 日本語作文 / 逐語訳つき作文コーパス / 日中韓の言語対照 |
研究実績の概要 |
令和1年度は、以下の2つの作業を行った。 ①一昨年度に引き続き、主に「作文の収集」を行った。執筆を依頼するにあたって「作文収集システム(執筆用WEBサイト)」を構築し、これを利用して自宅等で作文を執筆してもらった。日本国内で日本語を学習している中国語母語話者・韓国語母語話者(各60名、計120名)に、日本語作文(1000字)と、その中国語訳文・韓国語訳文(逐語訳)を執筆してもらった。執筆者の身分は日本の大学あるいは大学院に在籍している者とし、日本語レベルの条件は日本語能力試験N1合格以上とした。収集する作文の目標本数は合計240本となるが、一昨年度では全てを収集しきれなかったので、令和1年度も引き続き、同作業を行った。その結果、現在(令和2年度)において目標本数である合計240本を収集し終えている。 ②上記で述べた240本の日本語作文および中韓語訳文の分析を行った(現在も継続中)。まず、琉球大学に在籍している留学生(中国語母語話者1名・韓国語母語話者1名)に依頼して、各語訳文における文を全て形態素/語の単位に分割してもらった(同一執筆者による日本語作文における形態素/語との対応に留意しながら)。ただし、日本語と中韓語とは言うまでもなく構造が異なるので、それぞれの形態素/語が1対1で綺麗に対応するとは限らない。そこで、本科研メンバー(研究協力者)であり、中国語および韓国語の母語話者である蔡梅花氏が、留学生による形態素/語の分割の結果に改めて目を通し、検討の余地がある箇所を洗い出した。その検討の余地がある箇所について、本科研メンバー全員(金井・新城・蔡)で意見交換をしながら1つ1つ対応を検討し、必要に応じて形態素/語の分割を修正していく、という作業を行った。この作業は現在(令和2年度)も継続中であるが、夏季休暇前を目途に完了する予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
当初は、一昨年度のうちに合計240本(日本語作文120本+中韓語訳文120本)の作文を収集する予定であった。しかし、その収集作業を一昨年度だけでは終えることができず、昨年度の夏季休暇前まで掛かってしまったため、その遅れが響いている。 その収集した作文240本を電子的に処理するのに昨年度の12月までを要した。そして、その結果をもとに昨年度の春休み(2月~3月)に形態素/語への分割作業に取り掛かる予定であった。しかし、新型コロナの感染拡大により、一次的な作業を担当する留学生とのやりとりが順調に行かず、また本科研メンバーが一堂に会して合議する機会も逸してしまったため、そのことも遅れに繋がっている。 現在は遠隔会議(ZOOMを利用)にて定期的に会合を開催し、遅れを取り戻すべく、形態素/語への分割作業、およびその修正作業に取り組んでいる。
|
今後の研究の推進方策 |
最終年度である令和2年度は、以下の3つの作業を遂行する。 ①昨年度に終わらなかった作業を完了させる(現在、遂行中)。具体的には、前項で述べたように、中韓語訳文の形態素/語への分割を完了させることである。これは夏季休暇前に終わらせたい。 ②上記の作業が終わり次第、本科研の成果をWEB上でコーパスとして公表するための作業に取り掛かる。この作業は、必要に応じて、専門業者にも依頼することとなる。コーパスの仕様としては、以下の検索項目を(最低でも)備えておきたい。【執筆者の属性による検索として;母語話者別検索、作文のテーマ別検索。文字列による検索として;AND検索、OR検索】等々。また、誤用分析の目的にも本コーパスを利用可能とするため、コーパスの検索でヒットさせるべく、誤用を正用に修正しておかなければならず、その見極め(どのような事例を誤用と判断するか、どのような表現に修正するか、等々)の協議も必須である。なお、利用者が修正前の誤用を追跡できるように「誤用タグ」を付す。 ③完成前のコーパス(におけるデータ)を利用して、本科研メンバーが特定のテーマについて分析を行い、それを口頭発表、あるいは論文化する予定である。現段階で、本科研メンバー3名の連名による論文(1本)執筆のため、その分析に着手している。その他、メンバー個々人の論文を各1本(計3本)を、今年度末までに発表する予定である。
|
次年度使用額が生じた理由 |
2019年度に完了予定だった中韓語訳文の形態素分析の作業が、年度内には終わらなかったため。この作業では、作業者(中韓国を母語とする留学生)に対して、進捗状況に応じて随時の支払いを行うことになっていたが、(新型コロナの影響もあり)作業自体が遅延しているため、支払い自体も遅延している。今年度に予定していた作業に着手する前に、上述の昨年度の残りを完了させるため、夏季休暇前には昨年度からの残額を消費する。
|