研究課題/領域番号 |
18K11991
|
研究機関 | 公立はこだて未来大学 |
研究代表者 |
村井 源 公立はこだて未来大学, システム情報科学部, 准教授 (70452018)
|
研究期間 (年度) |
2018-04-01 – 2023-03-31
|
キーワード | 文体 / 発話 / 計量文体学 / 日常会話 / 物語文 |
研究実績の概要 |
文体特徴を適切に抽出する上では話者の属性や会話のコンテキストなどの諸情報を考慮した均衡コーパスの利用が望ましい.現在国立国語研究所で公開に向けて準備が進められている『日本語日常会話コーパス』(Corpus of Everyday Japanese Conversation, CEJC)は種々の場面における日常会話を話者の属性や関係性などに配慮してバランスよく収集した大規模かつ自然な日常会話のコーパスであるため,既に公開されている同じく国立国語研究所の『書き言葉均衡コーパス』と比較が有意義であると考えられる.そこで,すでに『書き言葉均衡コーパス』に基づき物語における登場人物間の会話分析で用いた19種類のカテゴリを採用し,話者の意図や文の機能の分析を行い,アノテーションを人手で実施した.結果として,一般的な日常会話に基づく話し言葉のコーパスでは,相槌などに相当する「応答」の機能が頻出であり,全体の約1/3ほどを占めていることが明らかになった.これは書き言葉での会話文とは全く異なる傾向である.他の相違点としては,実会話では,「依頼」「拒否」「他責」などの機能を用いることを避け,「提案」「感情」「願望」「質問」「評価」などで代用している可能性が示された.これらは,実会話では人間間の摩擦を避ける方向に意図が働くのに対して,物語の会話では人間間の関係性のダイナミズムを誇張して描く方向になることを示唆していると考えられる. また,機能語以外で属性による文体的な変化が表れやすいと言われているのが人称代名詞,特に話者の自称と聴者に対する呼びかけである.そこで,会話文中で用いられる一人称を示す自称詞と二人称を示す対称詞に対象を絞り,話し言葉と書き言葉の文中から抽出を行った.さらに抽出された自称詞と対称詞をカテゴリに分類し,話し言葉と書き言葉での多寡を比較した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
来年度実施予定の研究計画の半ばまで終えており,当初の想定以上の進展であると判断できる.
|
今後の研究の推進方策 |
会話文における機能語(助詞や助動詞),発話の意図や機能,呼称や人称(主に自称詞と対称詞),話者や聴者の属性や関係性などの多様なパラメータ間の関係性を統計的に分析する.またコーパスへのアノテーションを随時進める.
|
次年度使用額が生じた理由 |
コロナ下で遠隔地での学会発表参加が困難となり,旅費として予定していた予算を次年度に繰り越す形となった.これらの予算を人件費として用いてコーパスのアノテーション作業を拡充させる計画である.
|