研究課題/領域番号 |
26770180
|
研究機関 | 京都教育大学 |
研究代表者 |
中俣 尚己 京都教育大学, 教育学部, 准教授 (00598518)
|
研究期間 (年度) |
2014-04-01 – 2018-03-31
|
キーワード | 話題別特徴語 / 真正性 / 接触場面会話コーパス / 意味交渉 / 副詞 / 日本語教材のための語選定 / 話題に従属する機能語 / 話題シラバスと文法 |
研究実績の概要 |
26年度に『日中Skype会話コーパス』を公開し、そのデータを使った分析を行った。本コーパスは真正性のある場面を録音したことから、「明後日」「木曜日」「すげえ」など、従来の学習者コーパスには出現しなかった語が出現すること、縦断的データであること、一種の電話場面であること、各回の話題が指定されていること、といった特徴を持つ。 27年度は特徴の1つ、「各回の話題が指定されている」ことを活かし、まずケーススタディーとして、「食」に関する話題とそれ以外にコーパスを分割、それぞれを形態素解析システム「雪だるま」を利用して形態素に分割、続いて各コーパスにおける出現頻度を基に対数尤度比(LLR)を計算し、「食」に関する特徴語をあぶりだした。この知見は「第8回コーパス日本語学ワークショップ」にて発表し、高い評価を得た。 続いて、「ポップ・カルチャー」についても同様の分析を行い、2016年度の日本語教育学会春季大会で発表予定である。 これらと並行して、学習者と母語話者の違いも形態素解析の結果から分析した。その結果、驚くべきことに、使用語彙の豊富さを示すTTRの値は学習者と母語話者で一致し、差が見られなかった。これは意味交渉などの結果、使用語彙が同じになるということである。そして語彙の違いは話者よりも話題に強く依存すると言える。一方で仔細に分析すると、最も学習者と母語話者で使用傾向が異なる語は副詞であった。つまり、副詞は意味交渉の対象になりにくいということが示唆される。この知見は「日本語/日本語教育研究会」の第7回研究会で発表、その後同研究会のジャーナル(査読有り)に投稿し、受理された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
話題別特徴語は当初は3つある研究課題の1つであったが、教育的にも自然言語処理的にも想定以上の成果を得ることができた。 「食」に関しては約30,000語のコーパスから、244語が特徴語として自動抽出され、その90%以上が実際に「食」と関係していた。さらに残り10%の誤解析も、話題がそれた箇所に出現していたことがわかった。質的にも興味深い。例えば、「もの」という一般名詞が「食」の特徴語として抽出された。これは一見、直感に反するが、仔細に分析すると、「ハンバーグをパンで挟んだもの」のように「~を~したもの」という構文が「食」コーパスでのみ使われていた。これは直感ではわからないような特徴語を機械で抽出した成果といえ、教育上有益な情報である。 また、「ポップ・カルチャー」について、今度は会話の中身を確認し、実際に「ポップ・カルチャー」について話している部分だけを対象に分析を行ったところ、やはり約30,000語から251語を自動抽出し、ほぼ100%がポップカルチャーに関連していた。また、この分析では従来話題に従属しないとされていた「去年」「最近」や「ている」「た」などが抽出され、機能語であっても、話題との親和性が存在することを示唆する。 話題別の真正性のある会話を用意すれば、高精度でその話題に関連する語彙を半自動的にあぶりだせるという成果は教育への貢献が非常に大きい。さらに、機能語までもが話題と親和性があるということは経験的には知られていたが、それを定量的に示せたことも非常に大きい。
|
今後の研究の推進方策 |
話題別特徴語の自動抽出成果が極めて有益であると判断し、当初の計画を変更する。28年度はコーパスに収録されたすべての話題について、特徴語を一気に抽出し、そこからさらなる知見を得ることを目標とする。もちろん、9つほどの話題ですべての話題をカバーできるべくもないが、今後話題別コーパスを構築する際に役立つような知見を得ることが目標である。また、特徴語リストもwebで公開していきたい。 また、この作業を行うために、目視で話題を分割する作業が必要である。その作業の過程でコーパスに話題転換箇所をアノテーションする必要が生じる。これを利用し、話題転換時における言語行動の研究を本年度後半から次年度にかけて行っていく。
|
備考 |
教員免許更新講習においても、本研究から得られた知見を国語科の授業に生かす内容を盛り込んだ。
|