研究課題/領域番号 |
19K23068
|
研究種目 |
研究活動スタート支援
|
配分区分 | 基金 |
審査区分 |
0102:文学、言語学およびその関連分野
|
研究機関 | 筑波大学 |
研究代表者 |
今田 水穂 筑波大学, 人文社会系, 助教 (10579056)
|
研究期間 (年度) |
2019-08-30 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2019年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | 作文コーパス / 係り受け距離 / 児童作文コーパス / 形態論情報 / 節境界情報 / 係り受け情報 / 機械学習 / アノテーション / コーパス / 作文 / 埋め込み節 / 児童作文 / 文の複雑さ |
研究開始時の研究の概要 |
国語教育への応用を目的として、文の統語的な複雑さを計量的に評価する手法の研究を行う。本研究では特に語や文節ではなく節を単位とす る文構造の複雑性に注目し、並列節よりも埋め込み節 (名詞節・連体節) の方が認知的負荷が大きいという仮定に基づき、150 万語規模の児童作文コーパスに対する節情報などの付与と、統計的および質的分析を実施し、児童の言語発達と埋め込み節の頻度、深さ、機能などの関係を計量的に明らかにする。
|
研究実績の概要 |
構築したコーパスを用いた応用的研究の一環として、係り受け距離の分布に関する数理的な研究を行った。自然言語においては、距離の長い係り受けは認知的負荷が大きいため、語順を変えるなどして長い係り受けを避ける傾向があることが知られている。そこで、作文コーパスにおける係り受け構造とランダムに生成した係り受け構造を比較し、係り受け距離の分布を調べた。 その結果、同じ長さの文における係り受け距離平均の分布は、ランダムな構造においてはほぼ綺麗な対数正規分布になるが、自然言語においてはガンマ分布に接近することが分かった。また、文の長さと連動して係り受け距離平均の平均がどのように変化するかを調べたところ、ランダムな構造では係り受け距離平均が文長に対して冪的に増加するのに対して、自然言語においては対数的に増加することが分かった。これは自然言語の構造における係り受け距離の増大がランダムな構造よりも抑制的であることを示唆している。一般化線形混合モデル分析の結果からは、小学校中学年以降、学齢が上がるほど抑制的な傾向が顕著になることが確認された。一方で、5文節未満のごく短い文においては、自然言語の方がランダム構造よりも係り受け距離が長くなる傾向も確認された。 自然言語における係り受け距離がランダムな場合と比べて抑制的であることは既知の事実だったが、日本語のコーパスでよく用いられる文節係り受け構造における係り受け距離平均のモデルを構築した点がこの研究の意義と言える。研究成果は論文化し、投稿した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
論文投稿のタイミングの都合により計画を再延長したが、研究は概ね完了した。
|
今後の研究の推進方策 |
予定の研究は概ね完了した。今後は、構築したデータやモデルを活用した応用的研究を進めたい。
|