研究概要 |
目的:本研究は日本語リーダビリティー測定の尺度を構築し,ソフトウエアとして誰でも簡単に使えるものを製作することを目的とする。リーダビリティー(Readability)とは,文章の読み易さ・読み難さを数値で表したもので,現在までに各言語で200以上の公式があるが,日本語には本格的なものがない。ソフトウエア完成までの過程として,本研究が該当する2年間では,リーダビリティー公式を構築するための変数を決定することが具体的な目標である。 実施状況:本研究では日本語の文章の特徴として,(1)文字種が複数ある(漢字,平仮名,カタカナ,ローマ字),(2)語種が複数ある(漢語,和語,外来語,混種語)という2点,作業記憶研究の知見から(3)1文の長さ,認知心理学の文章理解研究の知見から(4)命題による1文の情報量の2点を加え,さらに(5)文構造の複雑さの5つの変数があると考えた。そこで,小学1年生から中学3年生までの国語教科書の読解教材でデータベースを作り,1文の平均文字数,1文の平均文節数,1文の平均述語数,テキストの漢語の割合,テキストの平仮名の割合を独立変数,学年を従属変数として,重回帰分析を行なったところ,漢語の割合が除外され,他の4変数で学年を判定する式が出来上がった。式は以下の通りである。Y=-0.148X1+1.585X2-0.117X3-0.126X4+15.581(Y=学年,X1=文章中の平仮名の割合,X2=1文の平均述語数,X3=1文の平均文字数,X4=1文の平均文節数)。(R値=0.862) 形態素解析にはMeCabとIPA辞書を使い,この公式を使って,文章の学年判定をするツールを作り,インターネットで公開した。 意義と重要性:本研究が開発したツールにより,以下のことが可能になった。(1)小中学生の作文を採点する歳に,文章の校正だけでなく,当該文章がどのぐらいの学年レベルであるかが判定できる。(2)小中学校で国語のテストを作成する際に,テストに使うテキストが当該学年にふさわしいかどうかが判定できる。(3)形態素解析に不慣れな人びとが簡便に解析ができる。
|