研究課題/領域番号 |
22K20232
|
研究機関 | 関西大学 |
研究代表者 |
麻 子軒 関西大学, 国際教育センター, 留学生別科特任常勤講師 (30880249)
|
研究期間 (年度) |
2022-08-31 – 2024-03-31
|
キーワード | 日本語教育 / 日中同形語 / 二字漢語 / 誤用 / 多変量解析 / 品詞性 / コーパス |
研究実績の概要 |
本研究は、「参考」「犠牲」といった日中同形二字漢語の品詞性における相違点に注目し、①両言語で品詞対応が異なるパターンを見つけ出した上で、②それらのパターンに属する語を抽出し、③アンケート調査で抽出した語の習得難易度を検証してから、④日中品詞性が対応しない同形二字漢語の語彙表を難易度付きで作成することを目的とするものである。今年度の予定は研究目的①と②を達成することである。実際の進捗状況は以下のようになっている。 ①をするに際して、まず日本語と中国語の大規模コーパスより同形二字漢語を抽出する必要がある。日本語の場合は、すでに既存のコーパスより必要なデータをすべて抽出済みである。中国語の場合は、既存のコーパスよりデータの抽出を行ったが、統計分析に耐えられる量のデータが不足し、自作コーパスによる追加データが必要となった。それを作成するための中国語書籍を台湾から調達し、裁断作業を経て、スキャナーによるOCR作業が終了している段階まで進んでいる。コーパス作成は本課題における対照研究を行うための基礎資料になるので、慎重に質の高いデータを整備することが重要である。 ②をするに際して、抽出した二字漢語を品詞別に分類した上で、前後の共起語の品詞や語彙素などのアノテーション情報の頻度を手がかりに、クラスター分析でパターン分類を行う必要がある。日本語のデータはすでに整備済みであるため、すべての該当語の品詞判定が終了している。日本語学領域において、二字漢語の品詞を統計的手法で推定する研究がまだ少なく、その判定結果を得られたこと自体にも意義があると思われる。中国語のデータはひとまず現段階収集したデータで分類を行ったが、まだデータが不足しているため期待通りの結果を得られなかった。次の対照研究というステップに進めるには中国語のデータの完成を待たなければならない状態である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
分析に必要な日本語のデータに関しては、予定通り既存のコーパスから必要な量のデータを抽出できたため、新たにコーパスを追加する必要はない。パソコンでの形態素解析と統計処理もすでに済んだ状態である。日本語のデータに対して実施すべき作業は当初の予定通り、順調に進展していると言えよう。 一方、中国語のデータに関しては、既存のコーパスから得られたデータ量が不足し、新たなコーパスを作成する必要があった。そのコーパスを構築するために、書籍をデータにする「OCR」と「テキスト校正」という、膨大な時間を要する作業が発生する。これらの作業は当初外注を予定していたが、予算上などの諸問題を総合的に考慮し、最終的に学内アルバイトという方法に切り替えることにした。その作業人員を確保するために時間を要し、中国語データに対する作業が若干遅れている状態である。 上記に示したように、日本語データへの作業のほうはほぼ予定通りだが、中国語データのほうは予定より遅れているため、本研究課題の全体的な進捗状況を「やや遅れている」と判断した。
|
今後の研究の推進方策 |
次年度では、まず予定より作業が遅れている「中国語の自作コーパスの作成」の続きを進めていく。その作業で、最も時間を要している「OCRで認識されたテキストに対する校正」がメインになるが、こちらの作業人員はすでに複数名確保しており、作業手順の説明も終わり、順調に作業が進捗している。半年程度の時間があれば、校正作業が終わる試算になっている。自作コーパスの作業が終わり次第、次のステップである統計による分析に着手することができる。 また、当初来年度に予定している、③アンケート調査で抽出した語の習得難易度を検証することと、④日中品詞性が対応しない同形二字漢語の語彙表を難易度付きで作成することは、①②の解析が終了しないと進めることができないが、日本語の部分はすでにデータが抽出済みであるため、事前に解析の準備を行うことができる。なお、アンケート調査に関しては、台湾の大学にも協力をしてもらう予定だが、事前に声がけしておき、9月の学期始めにすぐにでも開始できる状態にしておきたい。
|
次年度使用額が生じた理由 |
本研究課題の進捗状況で述べたように、中国語のデータに対する後作業である「OCR」と「テキスト校正」を行う人員の確保が遅れていることが、次年度使用額が生じた最大の原因である。当初本費目の予算は、上記のデータに対する後作業の外注用として申請したものだが、作業規模から試算した時間と予算額を総合的に考慮し、学内アルバイト方式で実施することに変更した。そのため、今年度使用しなかった当該予算額を、次年度では主に学内アルバイトの人件費に使用する予定である。 上記のデータが完成すれば、段階的な研究成果をまとめ、学会で発表することが可能となるため、今年度余剰した旅費を次年度に使用する予定である。また、当初翌年度に予定していたアンケート調査に関しては、上記の後作業が順調に進捗すれば、次年度の後半に予定通り実施できるため、協力者への謝金も計上する予定である。
|