• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実施状況報告書

大規模児童作文コーパスにおける埋め込み節の発達の計量的分析

研究課題

研究課題/領域番号 19K23068
研究機関筑波大学

研究代表者

今田 水穂  筑波大学, 人文社会系, 助教 (10579056)

研究期間 (年度) 2019-08-30 – 2023-03-31
キーワード児童作文コーパス / 形態論情報 / 節境界情報 / 係り受け情報 / 係り受け距離
研究実績の概要

昨年度までに更新が完了した「児童・生徒作文コーパス」形態論データver.1.6および節境界ラベルデータを用いて児童作文の語彙・文法に関する研究を行った。昨年度は学齢による節の使用状況の推移について研究を行い、論文の公開準備を進めていたが、この論文は今年度に査読が終了し、2021年7月に公開された。
今年度は文の統語的複雑性を計量的に評価する手法に関する研究を行った。単語数nの文における可能な統語木のパターン数はカタラン数で計算できることが知られている。カタラン数は階乗式で計算することができるが、漸化式として表現することもできる。これを参考にして、文節数n、係り受け距離和mの文における可能な係り受け構造のパターン数と、同様に文節数n、階層係り受け距離和mの文におけるパターン数を求める漸化式を求めた(日本語の規範的な構造として、係り受けは交差せず、常に右側に係るものとした)。この結果、両式はいずれも共通の漸化式f(n,m)で表現できること、f(n,x)の分布は対数正規分布になること、文節数nの文におけるmの期待値はべき乗則に従うことなどが分かった。これは係り受け構造の複雑さをlog(m)=a+b*log(n)として線形回帰によって分析できることを示唆する。
これに基づいて現代日本語書き言葉均衡コーパス、および児童・生徒作文コーパスにおける係り受け構造の複雑さを線形混合モデルで評価する研究を行い、言語資源活用ワークショップ2021で報告した。併せて2編の論文の公開を計画していたが、公開に至らなかった。引き続き、論文公開の準備を進める。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

コーパスの構築は既に終了しており、論文を公開して研究を終了する予定だったが、研究外の業務の増大のため十分な研究時間を確保できなかった。

今後の研究の推進方策

予定していた論文の公開準備を進める。

次年度使用額が生じた理由

論文投稿の費用を15万程度として、若干の余裕を残して予算を残していたが、投稿を翌年度に見送ったため。

  • 研究成果

    (2件)

すべて 2021

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (1件)

  • [雑誌論文] 「児童・生徒作文コーパス」に対する節境界ラベル付与2021

    • 著者名/発表者名
      今田, 水穂; 田川, 拓海; 文, 昶允; 那須, 昭夫
    • 雑誌名

      F1000 Reseach

      巻: - ページ: -

    • DOI

      10.12688/f1000research.40669.1

    • 査読あり / オープンアクセス
  • [学会発表] 児童作文における係り受け距離と階層距離2021

    • 著者名/発表者名
      今田, 水穂
    • 学会等名
      言語資源活用ワークショップ2021

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi