• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

日本語コーパスを応用した文章の難易測定の研究

研究課題

研究課題/領域番号 19011003
研究種目

特定領域研究

配分区分補助金
審査区分 人文・社会系
研究機関長岡技術科学大学

研究代表者

柴崎 秀子  長岡技術科学大学, 工学部, 教授 (00376815)

研究分担者 玉岡 賀津雄  広島大学, 留学生センター, 教授 (70227263)
山本 和英  長岡技術科学大学, 工学部, 准教授 (40359708)
加納 満  長岡技術科学大学, 工学部, 准教授 (80251859)
李 在鎬  情報通信研究機構, その他部局, 研究員 (20450695)
原 信一郎  長岡技術科学大学, 工学部, 准教授 (20242464)
研究期間 (年度) 2007 – 2008
研究課題ステータス 完了 (2008年度)
配分額 *注記
2,900千円 (直接経費: 2,900千円)
2008年度: 1,100千円 (直接経費: 1,100千円)
2007年度: 1,800千円 (直接経費: 1,800千円)
キーワード日本語コーパス / 文章の難易 / リーダビリティー / 文字種 / 語種 / 文章理解
研究概要

目的 : 本研究は大量の日本語コーパスを使って,日本語の文章の読み易さ・読み難さ(リーダビリティー)を数値で表す尺度(スケール)を構築することを目的とする。
実施状況 : 日本語の様々な読み物を電子ファイル化し,様々な分析に使えるコーパスを作った。そのために10数名の研究補助者を雇い入れ,(1) 小学1年から高校3年までの国語教科書51冊,(2) 日本語能力試験1&2級読解問題(2002年から2006年の5年分), (3) ベストセラーのケータイ小説2作品, (4) 出版部数の多い雑誌(文芸春秋, ESSE, MORE,WITHを各3か月分)をページごとにスキャンし, OCRを使い, コンピュータで使えるよう電子ファイルにした。(1)から(4)までのテキストのほか, すでにCD-Romとなっている「新潮文庫の100冊」「毎日新聞データ集2006年度版」を使い, 形態素解析を行なった。当初,解析にはChaSenを使っていたが, より精度を高めるため, MeCabとIPA辞書に切り替え, ツールの整備を行なった。国語教科書をデータベースとして構築された学年判定式(小学1年から中学3年まで)を用いて, 様々な読み物を測定したところ, 最近人気のあるケータイ小説は小学6年から中学1年レベル, 「星の王子さま」は翻訳者によって, 小学2年から5年レベルにあることがわかった。
本研究の意義 : 文章の難易を示す尺度が出来たことにより, 様々な文書のレベルを測定できる。例えば, 製品マニュアル, 薬の能書き, 災害マニュアルなどはわかりやすい文章で書かれるべきであるが, そのような文書を作成するための指標ができた。

報告書

(2件)
  • 2008 実績報告書
  • 2007 実績報告書
  • 研究成果

    (10件)

すべて 2008 2007 その他

すべて 雑誌論文 (2件) (うち査読あり 1件) 学会発表 (6件) 備考 (1件) 産業財産権 (1件)

  • [雑誌論文] 韓国語母語話者による和製英語の理解2008

    • 著者名/発表者名
      玉岡賀津雄・林燐情・池映任・柴崎秀子
    • 雑誌名

      レキシコンフォーラム 4

      ページ: 192-222

    • NAID

      40016388325

    • 関連する報告書
      2008 実績報告書
    • 査読あり
  • [雑誌論文] 日本語の文章の難易はどのように測定できるか2008

    • 著者名/発表者名
      柴崎秀子
    • 雑誌名

      AMMTジャーナル 44

      ページ: 5-8

    • 関連する報告書
      2008 実績報告書
  • [学会発表] 平成19年度研究進捗状況報告:リーダビリティー班:日本語コーパスを応用した文章の難易測定の研究2008

    • 著者名/発表者名
      柴崎秀子・玉岡賀津雄・山本和英・原信一郎・加納満・李在鎬
    • 学会等名
      日本語コーパス公開ワークショップ
    • 発表場所
      国立国語研究所
    • 年月日
      2008-03-16
    • 関連する報告書
      2007 実績報告書
  • [学会発表] 文章中の漢字と漢語の分析による日本語リーダビリティー公式構築のための基礎研究2008

    • 著者名/発表者名
      柴崎秀子・沢井康孝
    • 学会等名
      パリ漢語学会国際大会
    • 発表場所
      パリ第7大学
    • 年月日
      2008-03-14
    • 関連する報告書
      2007 実績報告書
  • [学会発表] 漢字表記と平仮名表記が文の読み易さに与える影響-日本語リーダビリティー構築のための基礎研究-2008

    • 著者名/発表者名
      柴崎秀子・玉岡賀津雄・沢井康孝
    • 学会等名
      言語科学会
    • 発表場所
      静岡県立大学
    • 関連する報告書
      2008 実績報告書
  • [学会発表] 国語教科書コーパスを応用した日本語リーダビリティー構築のための基礎研究2007

    • 著者名/発表者名
      柴崎秀子・沢井康孝
    • 学会等名
      電子情報通信学会
    • 発表場所
      キャンパスイノベーションセンター
    • 年月日
      2007-10-05
    • 関連する報告書
      2007 実績報告書
  • [学会発表] 「日本語コーパスを応用した文章の難易測定の研究2007

    • 著者名/発表者名
      柴崎秀子・玉岡賀津雄・山本和英・原信一郎・加納満
    • 学会等名
      特定領域研究「日本語コーパス」平成19年全体会議
    • 発表場所
      北陸先端科学技術大学院大学
    • 年月日
      2007-09-05
    • 関連する報告書
      2007 実績報告書
  • [学会発表] Developing a Readability Scale for Japanese Texts Using a Linear Multiple Regression Analysis Predicting School Grades 1-62007

    • 著者名/発表者名
      柴崎秀子
    • 学会等名
      アジア読書学会国際大会
    • 発表場所
      国際オリンピック記念青少年センター(東京)
    • 年月日
      2007-08-04
    • 関連する報告書
      2007 実績報告書
  • [備考] リーダビリティー・リサーチ・ラボ

    • URL

      http://readability.nagaokaut.ac.jp/research/html/modules/tinyd0/

    • 関連する報告書
      2008 実績報告書
  • [産業財産権] 文章の読み易さ評価システム及び文章の読み易さ評価方法2007

    • 発明者名
      柴崎秀子 原信一郎
    • 権利者名
      長岡技術科学大学
    • 産業財産権番号
      2007-169544
    • 出願年月日
      2007-06-27
    • 関連する報告書
      2008 実績報告書 2007 実績報告書

URL: 

公開日: 2007-04-01   更新日: 2018-03-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi