• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2011 年度 実績報告書

自然言語処理の技術を利用したタグ付き学習者作文コーパスの開発

研究課題

研究課題/領域番号 22520537
研究機関筑波大学

研究代表者

李 在鎬  筑波大学, 人文社会系, 准教授 (20450695)

研究分担者 宮岡 弥生  広島経済大学, 経済学部, 教授 (10351975)
林 〓情  山口県立大学, 国際文化学部, 准教授 (30412290)
柴崎 秀子  長岡技術科学大学, 工学部, 教授 (00376815)
キーワード教育工学 / 教材 / 教育メディア / 学習者コーパス / 形態素解析
研究概要

本研究は、言語処理の技術を利用し、タグ付き学習者作文コーパスを構築することである。コーパスの構築においては、単なる作文の収集ではなく、言語テストを組み合わせることで言語能力別の作文データベースを構築する。また、構築したコーパスは、ウェブインターフェイスを介して段階的に公開し、ユーザの評価を受けながら、漸次的に共有資源化する。三つの基本方針のもとでコーパス構築を進めている。1)学習環境の多様性に対応すべく,複数のサブグループを作る。これにより,学習者の中間言語に影響する外的要因を特定することができる。具体的には,母語で「韓国語,中国語,英語」,日本語レベルで「初級,中級,上級」,学習環境で「国内,国外」で分けており,各サブグループ20名分を集める。2)収集したデータは言語処理のソフトウェアを使用し,形態素解析を行ったあと,誤用タグを付与した上,添削を行なっている。3)「コーパス構築=データ公開」を大原則とする。そのため,作文収集時においてデータ提供者(日本語学習者)に使用許可をとっており,データ公開における著作権問題をクリアにしている。
平成22年度は、方針2)および方針3)に対応するウェブインタフェースを開発した。平成23年度は、方針1)にそって学習者の作文収集を行った。本年の成果として、2012年1月の時点で149名分の作文収集およびデータベース化が完了した。現在、研究成果は、http://sakubunjpn.org/において公開しており、コーパスとして利用可能な形になっている。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

平成22年度にシステムの開発およびグランドデザインが完了したため、平成23年度は、作文データの収集のみに専念することができた。

今後の研究の推進方策

1.データベースへの登録作業韓国語母語話者のデータは、収集が完了しており、デークベースへの登録作業のみ残っている。
2.英語母語話者のデータを収集する。

  • 研究成果

    (4件)

すべて 2011 その他

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (1件) 備考 (1件)

  • [雑誌論文] 大規模テストの読解問題作成過程へのコーパス利用の可能性2011

    • 著者名/発表者名
      李在鎬
    • 雑誌名

      日本語教育

      巻: 148 ページ: 84-98

    • 査読あり
  • [雑誌論文] 日本語能力試験の新たな取り組み2011

    • 著者名/発表者名
      李在鎬、川端一光、矢澤理子、堀川有美
    • 雑誌名

      言語教育評価研究

      巻: 2 ページ: 64-72

    • 査読あり
  • [学会発表] コーパスに基づく認知的構文研究2011

    • 著者名/発表者名
      李在鎬
    • 学会等名
      第8回応用言語学講座講演会
    • 発表場所
      名古屋大学(招待講演)
    • 年月日
      2011-12-02
  • [備考]

    • URL

      http://sakubun.jpn.org/

URL: 

公開日: 2013-06-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi