• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

日本語コーパスを応用した文章の難易測定の研究

Research Project

Project/Area Number 19011003
Research Category

Grant-in-Aid for Scientific Research on Priority Areas

Allocation TypeSingle-year Grants
Review Section Humanities and Social Sciences
Research InstitutionNagaoka University of Technology

Principal Investigator

柴崎 秀子  Nagaoka University of Technology, 工学部, 教授 (00376815)

Co-Investigator(Kenkyū-buntansha) 玉岡 賀津雄  広島大学, 留学生センター, 教授 (70227263)
山本 和英  長岡技術科学大学, 工学部, 准教授 (40359708)
加納 満  長岡技術科学大学, 工学部, 准教授 (80251859)
李 在鎬  情報通信研究機構, その他部局, 研究員 (20450695)
原 信一郎  長岡技術科学大学, 工学部, 准教授 (20242464)
Project Period (FY) 2007 – 2008
Project Status Completed (Fiscal Year 2008)
Budget Amount *help
¥2,900,000 (Direct Cost: ¥2,900,000)
Fiscal Year 2008: ¥1,100,000 (Direct Cost: ¥1,100,000)
Fiscal Year 2007: ¥1,800,000 (Direct Cost: ¥1,800,000)
Keywords日本語コーパス / 文章の難易 / リーダビリティー / 文字種 / 語種 / 文章理解
Research Abstract

目的 : 本研究は大量の日本語コーパスを使って,日本語の文章の読み易さ・読み難さ(リーダビリティー)を数値で表す尺度(スケール)を構築することを目的とする。
実施状況 : 日本語の様々な読み物を電子ファイル化し,様々な分析に使えるコーパスを作った。そのために10数名の研究補助者を雇い入れ,(1) 小学1年から高校3年までの国語教科書51冊,(2) 日本語能力試験1&2級読解問題(2002年から2006年の5年分), (3) ベストセラーのケータイ小説2作品, (4) 出版部数の多い雑誌(文芸春秋, ESSE, MORE,WITHを各3か月分)をページごとにスキャンし, OCRを使い, コンピュータで使えるよう電子ファイルにした。(1)から(4)までのテキストのほか, すでにCD-Romとなっている「新潮文庫の100冊」「毎日新聞データ集2006年度版」を使い, 形態素解析を行なった。当初,解析にはChaSenを使っていたが, より精度を高めるため, MeCabとIPA辞書に切り替え, ツールの整備を行なった。国語教科書をデータベースとして構築された学年判定式(小学1年から中学3年まで)を用いて, 様々な読み物を測定したところ, 最近人気のあるケータイ小説は小学6年から中学1年レベル, 「星の王子さま」は翻訳者によって, 小学2年から5年レベルにあることがわかった。
本研究の意義 : 文章の難易を示す尺度が出来たことにより, 様々な文書のレベルを測定できる。例えば, 製品マニュアル, 薬の能書き, 災害マニュアルなどはわかりやすい文章で書かれるべきであるが, そのような文書を作成するための指標ができた。

Report

(2 results)
  • 2008 Annual Research Report
  • 2007 Annual Research Report
  • Research Products

    (10 results)

All 2008 2007 Other

All Journal Article (2 results) (of which Peer Reviewed: 1 results) Presentation (6 results) Remarks (1 results) Patent(Industrial Property Rights) (1 results)

  • [Journal Article] 韓国語母語話者による和製英語の理解2008

    • Author(s)
      玉岡賀津雄・林燐情・池映任・柴崎秀子
    • Journal Title

      レキシコンフォーラム 4

      Pages: 192-222

    • NAID

      40016388325

    • Related Report
      2008 Annual Research Report
    • Peer Reviewed
  • [Journal Article] 日本語の文章の難易はどのように測定できるか2008

    • Author(s)
      柴崎秀子
    • Journal Title

      AMMTジャーナル 44

      Pages: 5-8

    • Related Report
      2008 Annual Research Report
  • [Presentation] 平成19年度研究進捗状況報告:リーダビリティー班:日本語コーパスを応用した文章の難易測定の研究2008

    • Author(s)
      柴崎秀子・玉岡賀津雄・山本和英・原信一郎・加納満・李在鎬
    • Organizer
      日本語コーパス公開ワークショップ
    • Place of Presentation
      国立国語研究所
    • Year and Date
      2008-03-16
    • Related Report
      2007 Annual Research Report
  • [Presentation] 文章中の漢字と漢語の分析による日本語リーダビリティー公式構築のための基礎研究2008

    • Author(s)
      柴崎秀子・沢井康孝
    • Organizer
      パリ漢語学会国際大会
    • Place of Presentation
      パリ第7大学
    • Year and Date
      2008-03-14
    • Related Report
      2007 Annual Research Report
  • [Presentation] 漢字表記と平仮名表記が文の読み易さに与える影響-日本語リーダビリティー構築のための基礎研究-2008

    • Author(s)
      柴崎秀子・玉岡賀津雄・沢井康孝
    • Organizer
      言語科学会
    • Place of Presentation
      静岡県立大学
    • Related Report
      2008 Annual Research Report
  • [Presentation] 国語教科書コーパスを応用した日本語リーダビリティー構築のための基礎研究2007

    • Author(s)
      柴崎秀子・沢井康孝
    • Organizer
      電子情報通信学会
    • Place of Presentation
      キャンパスイノベーションセンター
    • Year and Date
      2007-10-05
    • Related Report
      2007 Annual Research Report
  • [Presentation] 「日本語コーパスを応用した文章の難易測定の研究2007

    • Author(s)
      柴崎秀子・玉岡賀津雄・山本和英・原信一郎・加納満
    • Organizer
      特定領域研究「日本語コーパス」平成19年全体会議
    • Place of Presentation
      北陸先端科学技術大学院大学
    • Year and Date
      2007-09-05
    • Related Report
      2007 Annual Research Report
  • [Presentation] Developing a Readability Scale for Japanese Texts Using a Linear Multiple Regression Analysis Predicting School Grades 1-62007

    • Author(s)
      柴崎秀子
    • Organizer
      アジア読書学会国際大会
    • Place of Presentation
      国際オリンピック記念青少年センター(東京)
    • Year and Date
      2007-08-04
    • Related Report
      2007 Annual Research Report
  • [Remarks] リーダビリティー・リサーチ・ラボ

    • URL

      http://readability.nagaokaut.ac.jp/research/html/modules/tinyd0/

    • Related Report
      2008 Annual Research Report
  • [Patent(Industrial Property Rights)] 文章の読み易さ評価システム及び文章の読み易さ評価方法2007

    • Inventor(s)
      柴崎秀子 原信一郎
    • Industrial Property Rights Holder
      長岡技術科学大学
    • Industrial Property Number
      2007-169544
    • Filing Date
      2007-06-27
    • Related Report
      2008 Annual Research Report 2007 Annual Research Report

URL: 

Published: 2007-04-01   Modified: 2018-03-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi