研究課題/領域番号 |
16K04751
|
研究機関 | 富山大学 |
研究代表者 |
宮城 信 富山大学, 人間発達科学部, 准教授 (20534134)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
キーワード | 作文分析 / 文体 / 国語科教育 / コーパス / 計量的分析 / 作文支援 |
研究実績の概要 |
本研究の中心的な探求課題は、文種の異なる作文を比較して諸特徴(語彙・表現・構成等)を抽出することである。一昨年度に引き続き作文コーパスの構築を進めた。 本年度の中心的な作業は、電子化を終えたテキストを機械解析して語彙論情報を付したこと、比較に向けてフォーマットを統一する作業を進めたことである(作文は様々な状況で作成されており、単純比較を行うことは難しい)。また個人レベルでの比較を行う目的で同一個人を特定できるよう作文別整理番号の名寄せ作業を進めている(個人情報は取得しない、あくまで整理番号を介した同定作業である)。 一部のデータはコアデータとして専門業者による修正作業を実施した。分析はこのコアデータを中心に行っている。BCCWJとの連携も意識して、一部のデータには分類語彙表番号を付与する試みも実施している。語彙カテゴリにも拠るが、これまでと異なった観点から、新たに効果的な分析が進められる手応えを得た。 分析作業としては、語種別・品詞別等の観点から数量的な差異を検討した。結果、ある程度の偏りは見られたか、現在までに文種を特定できる特徴を抽出するには至っていない。本研究の探求課題が、文種の書き分けとその計量的分析であるので、研究成果は個別の論文より、単語集・文章用例数と言った資料集として提出できると考えている。現在試行的な分析データの整備を進めている段階である。論文化に向けて、どのような観点からの分析が可能となるか試行錯誤をくり返している。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
収集予定だった作文資料が紙原稿以外に、電子データで収集することが可能になり、入力作業の負担が軽減された。一方で、作業協力者による電子化作業で、思った以上に入力ミスが見られ、予想以上にチェック作業が必要となった。これらの状況を総合的に考えると、研究の進捗状況はほぼ予定通り人推移していると考えられる。
|
今後の研究の推進方策 |
昨年度で研究に必要な資料はほぼ整備されたと言って良い。 データに関しては、本年度では新規にデータを構築するのではなく、分析に適した形に修正する作業を中心的に進めていく。 またよりよい分析手法を導入するために新たなアノテーションが必要になる可能性があり、データの補正を含め、ある程度の時間とコストが必要になると考えている。 データの分析に当たっては、語の比較を中心に進める予定であったが、最近研究が進められているword2vec等比較的新しい分析手法を取り入れる計画を進めている。これらの新たな観点を取り入れることによって、人手による分析とは異なる結果が得られる可能性があり、現時点ではもっとも有効な手段の一つであると考えている。
|