• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実施状況報告書

縦断型接触場面コーパスの構築とそれを用いた日本語教育のための談話研究

研究課題

研究課題/領域番号 26770180
研究機関京都教育大学

研究代表者

中俣 尚己  京都教育大学, 教育学部, 准教授 (00598518)

研究期間 (年度) 2014-04-01 – 2018-03-31
キーワード話題別特徴語 / 真正性 / 接触場面会話コーパス / 意味交渉 / 副詞 / 日本語教材のための語選定 / 話題に従属する機能語 / 話題シラバスと文法
研究実績の概要

26年度に『日中Skype会話コーパス』を公開し、そのデータを使った分析を行った。本コーパスは真正性のある場面を録音したことから、「明後日」「木曜日」「すげえ」など、従来の学習者コーパスには出現しなかった語が出現すること、縦断的データであること、一種の電話場面であること、各回の話題が指定されていること、といった特徴を持つ。
27年度は特徴の1つ、「各回の話題が指定されている」ことを活かし、まずケーススタディーとして、「食」に関する話題とそれ以外にコーパスを分割、それぞれを形態素解析システム「雪だるま」を利用して形態素に分割、続いて各コーパスにおける出現頻度を基に対数尤度比(LLR)を計算し、「食」に関する特徴語をあぶりだした。この知見は「第8回コーパス日本語学ワークショップ」にて発表し、高い評価を得た。
続いて、「ポップ・カルチャー」についても同様の分析を行い、2016年度の日本語教育学会春季大会で発表予定である。
これらと並行して、学習者と母語話者の違いも形態素解析の結果から分析した。その結果、驚くべきことに、使用語彙の豊富さを示すTTRの値は学習者と母語話者で一致し、差が見られなかった。これは意味交渉などの結果、使用語彙が同じになるということである。そして語彙の違いは話者よりも話題に強く依存すると言える。一方で仔細に分析すると、最も学習者と母語話者で使用傾向が異なる語は副詞であった。つまり、副詞は意味交渉の対象になりにくいということが示唆される。この知見は「日本語/日本語教育研究会」の第7回研究会で発表、その後同研究会のジャーナル(査読有り)に投稿し、受理された。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

話題別特徴語は当初は3つある研究課題の1つであったが、教育的にも自然言語処理的にも想定以上の成果を得ることができた。
「食」に関しては約30,000語のコーパスから、244語が特徴語として自動抽出され、その90%以上が実際に「食」と関係していた。さらに残り10%の誤解析も、話題がそれた箇所に出現していたことがわかった。質的にも興味深い。例えば、「もの」という一般名詞が「食」の特徴語として抽出された。これは一見、直感に反するが、仔細に分析すると、「ハンバーグをパンで挟んだもの」のように「~を~したもの」という構文が「食」コーパスでのみ使われていた。これは直感ではわからないような特徴語を機械で抽出した成果といえ、教育上有益な情報である。
また、「ポップ・カルチャー」について、今度は会話の中身を確認し、実際に「ポップ・カルチャー」について話している部分だけを対象に分析を行ったところ、やはり約30,000語から251語を自動抽出し、ほぼ100%がポップカルチャーに関連していた。また、この分析では従来話題に従属しないとされていた「去年」「最近」や「ている」「た」などが抽出され、機能語であっても、話題との親和性が存在することを示唆する。
話題別の真正性のある会話を用意すれば、高精度でその話題に関連する語彙を半自動的にあぶりだせるという成果は教育への貢献が非常に大きい。さらに、機能語までもが話題と親和性があるということは経験的には知られていたが、それを定量的に示せたことも非常に大きい。

今後の研究の推進方策

話題別特徴語の自動抽出成果が極めて有益であると判断し、当初の計画を変更する。28年度はコーパスに収録されたすべての話題について、特徴語を一気に抽出し、そこからさらなる知見を得ることを目標とする。もちろん、9つほどの話題ですべての話題をカバーできるべくもないが、今後話題別コーパスを構築する際に役立つような知見を得ることが目標である。また、特徴語リストもwebで公開していきたい。
また、この作業を行うために、目視で話題を分割する作業が必要である。その作業の過程でコーパスに話題転換箇所をアノテーションする必要が生じる。これを利用し、話題転換時における言語行動の研究を本年度後半から次年度にかけて行っていく。

備考

教員免許更新講習においても、本研究から得られた知見を国語科の授業に生かす内容を盛り込んだ。

  • 研究成果

    (11件)

すべて 2016 2015 その他

すべて 雑誌論文 (1件) (うち査読あり 1件、 謝辞記載あり 1件) 学会発表 (6件) (うち国際学会 1件、 招待講演 2件) 図書 (3件) 備考 (1件)

  • [雑誌論文] 学習者と母語話者の使用語彙の違い―『日中Skype会話コーパス』を用いて―2016

    • 著者名/発表者名
      中俣尚己
    • 雑誌名

      日本語/日本語教育研究

      巻: 7 ページ: 21-34

    • 査読あり / 謝辞記載あり
  • [学会発表] 真正性のある接触場面会話コーパスを用いた話題別特徴語の抽出―ポップ・カルチャーの場合―2016

    • 著者名/発表者名
      中俣尚己
    • 学会等名
      日本語教育学会2016年度春季大会
    • 発表場所
      目白大学
    • 年月日
      2016-05-22 – 2016-05-22
  • [学会発表] コーパスを活用した例文作りのための研究をどう進めるか2016

    • 著者名/発表者名
      中俣尚己
    • 学会等名
      公開シンポジウム「コーパスから始まる例文作り」
    • 発表場所
      聖心女子大学
    • 年月日
      2016-03-21 – 2016-03-21
    • 招待講演
  • [学会発表] Productivity and Learning Difficulty of Verbs: A Case for Verbs Related to “Eating” in Japanese2016

    • 著者名/発表者名
      Naoki Nakamata
    • 学会等名
      8o CONGRESO INTERNACIONAL DE LINGUISTICA DE CORPUS
    • 発表場所
      Silken Pueruta Hotel Malaga (スペイン)
    • 年月日
      2016-03-03 – 2016-03-03
    • 国際学会
  • [学会発表] 真正性のある接触場面コーパスが明らかにする学習者と母語話者の発話の違い2015

    • 著者名/発表者名
      中俣尚己
    • 学会等名
      はごろも科研研究会2015 コーパス構築とコーパスに基づいた日本語文法・日本語教育研究
    • 発表場所
      東洋大学
    • 年月日
      2015-12-12 – 2015-12-12
    • 招待講演
  • [学会発表] 接触場面における学習者と母語話者の語彙はどこが異なるのか?―「日中Skype会話コーパス」の分析―2015

    • 著者名/発表者名
      中俣尚己
    • 学会等名
      日本語/日本語教育研究会 第7回大会
    • 発表場所
      学習院女子大学
    • 年月日
      2015-09-27 – 2015-09-27
  • [学会発表] 「日中Skype会話コーパス」を用いた話題別語彙の抽出―「食」の場合―2015

    • 著者名/発表者名
      中俣尚己
    • 学会等名
      第8回コーパス日本語ワークショップ
    • 発表場所
      国立国語研究所
    • 年月日
      2015-09-01 – 2015-09-01
  • [図書] 日本語教材研究の視点2016

    • 著者名/発表者名
      吉田英幸・本田弘之(編)
    • 総ページ数
      未刊
    • 出版者
      くろしお出版
  • [図書] コーパスから始まる例文作り2016

    • 著者名/発表者名
      中俣尚己(編)
    • 総ページ数
      未刊
    • 出版者
      くろしお出版
  • [図書] 学習者コーパスと日本語教育研究2016

    • 著者名/発表者名
      迫田久美子・野田尚史(編)
    • 総ページ数
      未刊
    • 出版者
      くろしお出版
  • [備考] 中俣尚己のウェブサイト

    • URL

      http://nakamata.info/index.html

URL: 

公開日: 2017-01-06  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi