• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Research-status Report

XMLコーパスからの抽出データに基づく日本語学術ライティング教材作成法の研究

Research Project

Project/Area Number 25540163
Research Category

Grant-in-Aid for Challenging Exploratory Research

Research InstitutionOsaka University

Principal Investigator

堀 一成  大阪大学, 全学教育推進機構, 准教授 (80270346)

Co-Investigator(Kenkyū-buntansha) 坂尻 彰宏  大阪大学, 全学教育推進機構, 准教授 (30512933)
石島 悌  地方独立行政法人大阪府立産業技術総合研究所, 業務推進課, 主任研究員 (80359398)
Project Period (FY) 2013-04-01 – 2016-03-31
Keywords学習コンテンツ / 日本語コーパス / データマイニング / アカデミック・ライティング / 大学リポジトリ / コロケーション / BCCWJ / eラーニング
Research Abstract

平成25年度は研究開始の年度であり、XML データであるBCCWJ(国立国語研究所開発の現代日本語書き言葉均衡コーパス)からの語彙頻度・語共起情報の抽出作業と、その日本語ライティング教材化作業を主に行った。コーパスデータをデータベースソフトウェアMySQLに格納し、連携して統計処理を行うプログラムを統計処理システムR上で開発し、処理を行った。特にBCCWJの高校教科書データ部を対象とした処理を行ったことにより、学術的な文章でよく利用されるものに近い名詞・動詞の頻度表リストを得ることができた。得られた頻度表リストは、大阪大学で開講しているライティング指導セミナー型授業の一教材として受講生に提供した。より学術文章に特化した情報抽出を行うため、公開コーパス化されていない学術文も追加収集を予定しており、そのための技術開発を進めた。XML化されていないテキストデータに対し、形態素解析ソフトウェアMeCabを統計処理ソフトRと連動させて処理を行うことにより、言語学的情報を付与した形でデータベースに格納することができた。上記の成果は、大学教育学会第35回全国大会・電子情報通信学会第3回テキストマイニングシンポジウム・第4回コーパス日本語学ワークショップなどの学会等で発表した。また、本研究で得られた成果も一部含む内容を持つ、大学初年次生向けライティングテキスト「阪大生のためのアカデミック・ライティング入門」を作成した。平成26年度のできるだけ早い時期に配布すると共に、大阪大学リポジトリ上で公開できるよう作業を進めている。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

平成25年度の研究予定事項は、現代日本語書き言葉均衡コーパス(BCCWJ) データからの学術文特徴抽出法研究を主とするものであった。この項目に関しては、研究実績の概要でも述べたように、BCCWJの高校教科書データをデータベースに格納し、連携して統計処理を行うプログラムで処理することを行ったことにより、学術的な文章でよく利用されるものに近い名詞・動詞の頻度表リストを得ることができており、計画した研究成果に到達しているといえる。その成果は各種学会等で発表済である。
XMLコーパス化されていない学術文を追加収集するための技術開発も進め、試験的に形態素情報を付与したデータをデータベースに格納する作業する段階までは到達した。ただし、その技術を利用し、広範に学術文を収集し、データベースに格納する作業には着手できていない。
また、教材開発として、平成25年度中には計画していなかった、大学初年次生向けライティングテキスト「阪大生のためのアカデミック・ライティング入門」を作成したことは、計画以上に進展している項目といえる。
以上の理由により、本研究の達成度が「おおむね順調に進展している」状況であると判断した。

Strategy for Future Research Activity

平成26年度、平成27年度は、大阪大学リポジトリOUKAより、学術文に特徴的な言語情報を抽出することが主な作業内容となる。そのために、平成25年度より開始している、XML化されていないテキストデータを解析し、データベースに格納し、統計処理をする手順についての開発を進める。
継続する作業により得られていた言語特徴情報を、初学者にわかりやすい学習コンテンツとなるよう構成し、日本語学術ライティング教育に広く活用する。また、紙資料だけでなく、同内容を大阪大学e ラーニングシステム(CLE) の学習コンテンツとして提供し、広範に利用する。
大阪府産業技術総合研究所においても、これまでに得られたコーパス解析情報を若手研究者が論文・報告書を作成する際の参考資料として活用する。
得られた研究成果は、年1回程度開催予定の全体研究会で報告するとともに、各種の産官学フェアや学会発表等で成果公開する。
また、平成25年度中に作成した大学初年次生向けライティングテキスト「阪大生のためのアカデミック・ライティング入門」を、平成26年度の早い時期に配布すると共に、大阪大学リポジトリOUKA(Osaka University Knowledge Archive)上で公開する。

Expenditure Plans for the Next FY Research Funding

平成25年度のアルバイトによる研究補助作業の進展が、計画通り進行できなかったことが、次年度使用額が生じた主な理由である。当初計画していた以上に、対象作業がデータベースと統計プログラミングの専門知識を必要とするものであり、その作業を担当可能なアルバイト作業者の確保が困難であった。
また、上記作業用のデスクトップPCを購入したため、当初平成25年度に購入を計画していたデータ解析用ワークステーションの購入を次年度以降とすることにした。そのため、その差額が次年度使用額として残った。
平成26年度中の作業用アルバイト確保をより積極的に行う。平成25年度中の作業者に引き続き作業するよう要請するとともに、新たに担当可能な者を広く募集する予定である。また、購入延期としたワークステーションが購入可能か、経費執行計画の再度見直しを図る。

  • Research Products

    (4 results)

All 2014 Other

All Presentation (3 results) Book (1 results)

  • [Presentation] コモンズスペースを利用した教員・図書館職員・TA協働ライティング指導

    • Author(s)
      堀 一成、久保山 健
    • Organizer
      大学教育学会 第35回年次大会
    • Place of Presentation
      東北大学 川内北キャンパス
  • [Presentation] BCCWJ教科書データより抽出した頻度情報に基づく日本語ライティング指導教材の作成

    • Author(s)
      堀  一成、坂尻 彰宏、石島 悌
    • Organizer
      第4回コーパス日本語学ワークショップ
    • Place of Presentation
      国立国語研究所
  • [Presentation] 現代日本語書き言葉均衡コーパスより抽出した頻度情報に基づく日本語学術ライティング指導教材の作成

    • Author(s)
      堀  一成、坂尻 彰宏、石島 悌
    • Organizer
      電子情報通信学会 第3回テキストマイニングシンポジウム
    • Place of Presentation
      国立オリンピック記念青少年総合センター
  • [Book] 阪大生のためのアカデミック・ライティング入門2014

    • Author(s)
      堀一成、坂尻彰宏
    • Total Pages
      32
    • Publisher
      大阪大学全学教育推進機構

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi