研究課題/領域番号 |
26770180
|
研究機関 | 京都教育大学 |
研究代表者 |
中俣 尚己 京都教育大学, 教育学部, 准教授 (00598518)
|
研究期間 (年度) |
2014-04-01 – 2018-03-31
|
キーワード | 話題 / 特徴語 / 対数尤度比 / 機能語 / 文法項目 / 難易度 |
研究実績の概要 |
『日中Skype会話コーパス』の分析を継続して行った。前年度までの研究で、話題による特徴語抽出が極めて効果的に働くことがわかったため、この課題を重点的に行った。まず、2016年5月には、日本語教育学会にて「真正性のある接触場面会話コーパスを用いた話題別特徴語の抽出―ポップ・カルチャーの場合―」というタイトルで発表を行った。ポップ・カルチャーの話題では「監督」「タイトル」といった名詞のみならず、「ている」「昨年」といった時間に関する機能語が偏って出現するという画期的な発見を発表した。これは、トピックベースの教材作りに大きく貢献する情報である。 その後、コーパスの全体を話題に分割するという作業を、協力者と2人で行った。コーパス全体に話題の区切りタグを挿入した。話題は当初会話活動で設定したものに加え、『実践日本語教育スタンダード』なども参考に協力者と協議し、最終的に「ポップカルチャー」「家庭」「開始部」「休暇」「言語」「終結部」「小中高」「大学」「町」「天気」「伝統」「約束」「料理」「恋愛」「その他」の15のサブコーパスに分類、長岡技術科学大学の山本和英氏に依頼しテキストファイルを15に分割した上で、語解析システム「雪だるま」を用いて単語に分割した。その後、それぞれを目的コーパス、その他を参照コーパスとした上で、対数尤度比を計算し、特徴語を抽出した。この中にはやはりこれまで話題に従属するとは考えられていなかった機能語が含まれていた。この結果は2017年7月のICPLJ10で「語彙は話題に従属する、文法も話題に従属する」と題して口頭発表を行い、その後『日本語教育』などに投稿する予定である。 なお、『日中Skype会話コーパス』の配布は継続しており、これまでのダウンロード数は90 件である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初はコーパスを用いて様々な角度から分析を進める予定であったが、話題別特徴語の抽出に大きな成果が見られたため、それに集中して研究を行うことにした。そのテーマの中では、機能語の話題ごとの偏りというこれまで知られていなかった新しい事実を発見することができた。
|
今後の研究の推進方策 |
最終年度となる本年度では『日中Skypeコーパス』すべてを話題に分割して特徴語を抽出し、特徴語リストの完全版を作成する予定である。それとともに、一つの話題について、授業案・教材案なども作成する。論文の形で公開する他、特徴語リストはデータの形でホームページからダウンロードできるようにすることも検討する。(ただし、査読誌での論文発表を優先する。) 本コーパスのさらなる普及も課題である。特に中国での研究会で本科研の成果について公開することを計画している。また、コーパス利用に関する教科書を執筆予定であるが、そこでも本コーパスを利用し、否定応答表現の偏りなど興味深い現象を盛り込んで、本コーパスの存在や価値をアピールしていきたい。
|
次年度使用額が生じた理由 |
アルバイトを使ったタグ付け作業が予定したペースで進まなかったため。
|
次年度使用額の使用計画 |
旅費と物品費に充てる。
|