研究課題/領域番号 |
18K00678
|
研究機関 | 埼玉大学 |
研究代表者 |
金井 勇人 埼玉大学, 人文社会科学研究科, 教授 (70516319)
|
研究分担者 |
新城 直樹 琉球大学, グローバル教育支援機構, 講師 (90367128)
河 正一 帝京大学, 公私立大学の部局等, 講師 (20812150)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 日本語作文 / 逐語訳つき作文コーパス / 日中韓の言語対照 |
研究実績の概要 |
平成30年度は主に「作文の収集」を行った。日本国内で日本語を学習している中国語母語話者・韓国語母語話者(各60名、計120名)に、日本語作文(1000字)と、その中国語訳文・韓国語訳文(逐語訳)を執筆してもらった。執筆者の身分は日本の大学あるいは大学院に在籍している者とし、日本語レベルの条件は日本語能力試験N1合格以上とした。 執筆を依頼するにあたって「作文収集システム(執筆用WEBサイト)」を構築し、これを利用して自宅等で作文を執筆してもらった。このサイトは以下のような仕様とした。①日本語および中国語・韓国語が滞りなく入力できる。②コピー&ペーストや予測変換などができない。③完成した作文はWEB上でファイル化され、それをEメールで送信してもらう。 執筆してもらう作文のジャンルは、その分析の目的に応じて、以下の3つとした。①説明文:あなたの好きな母国の“ことわざ”について説明してください。⇒基本的な文法項目がバランスよく出現することが期待されるため、主に文法項目の分析資料として適する。②描写文:あなたの尊敬する恩師(学校の先生など)とのエピソードを描写してください⇒尊敬語や謙譲語をはじめ、さまざまな敬語が抽出できることが期待されるため、主に待遇表現項目の分析資料として適する。③物語文:4つの絵(執筆者には別途提示)を見て、自由にストーリー(物語)を作ってください。ただし(それぞれの絵に付した)数字の順番は変えても構いません。⇒比喩表現の他にも、文学的表現なども抽出できることが期待されるため、主に表現項目の分析資料として適する。 以上を整理すると、収集する作文の目標本数は、合計240本となる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
当初の予定では、平成30年度内に、合計240本(日本語作文120本+訳文120本)の作文を収集する予定であった。中国語母語話者の作文は114本(日本語作文57本+訳文57本)収集することができ、おおむね順調に進展した。しかし、韓国語母語話者の作文は48本(日本語作文24本+訳文24本)を収集するに留まった。これは、作文執筆者の資格として「日本の大学あるいは大学院に在籍していること」という条件を課したことによる。日本の大学あるいは大学院に在籍している韓国語母語話者の人数は、中国語母語話者に比して少なく、執筆者を確保することに難航したからである。平成31年度になり、韓国語母語話者の新入生が候補者となり得るので、早急に残りの作文を収集したい。
|
今後の研究の推進方策 |
平成31年度は、前項で述べたように、作文の収集を完了させることを、第一の目標とする。これは夏季休暇の前に終わらせたい。この作文の収集と並行して、当初の予定通り、以下の作業も進めていく。 まず、収集した作文をデータ化していき(収集したものから順次)、その処理を行う。その際には、作文コーパスの検索でヒットさせるため、誤用を正用に修正する。ただし、誤用の分析にも本コーパスを利用できるようにするため、もとの誤用を追跡できるようにして「誤用タグ」を付しておく。 次に、形態素解析を行う。この作業では、日本語作文についてはMecab(IPA品詞体系)を、中国語訳文については「ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)」および「NAIST Chinese Dictionary」を、韓国語訳文についてはMecab用辞書「HanDic」およびその他の複数の辞書を、それぞれ用いる予定である。 最後に、それぞれの解析結果が出そろった時点で、本研究課題の目的に合わせて詳細な品詞体系のタグ付けを行う(例えば、Mecab(IPA品詞体系)では「は」と「も」は「係助詞」情報タグが付されるだけである)。 最終的に整理されたデータは、作文コーパスの検索システム用にSQLデータベースに格納する予定である。
|
次年度使用額が生じた理由 |
当初の予定では、平成30年度内に、合計240本(日本語作文120本+訳文120本)の作文を収集する予定であった。中国語母語話者の作文は114本(日本語作文57本+訳文57本)収集することができ、おおむね順調に進展した。しかし、韓国語母語話者の作文は48本(日本語作文24本+訳文24本)を収集するに留まった。これは、作文執筆者の資格として「日本の大学あるいは大学院に在籍していること」という条件を課したことによる。日本の大学あるいは大学院に在籍している韓国語母語話者の人数は、中国語母語話者に比して少なく、執筆者を確保することに難航したからである。 以上のような経緯によって、次年度使用額が生じた。平成31年度(令和元年度)となり、韓国語母語話者の新入生が候補者となり得る。早急に残りの作文を収集することによって、これらの金額を使用する計画である。
|