Research Abstract |
本研究は日本語リーダビリティー測定の尺度を構築し,ソフトウエアとして誰でも簡単に使えるものを製作することを最終目的とする。リーダビリティー(Readability)とは,文章の読み易さ・読み難さを数値で表したもので,現在までに各言語で200以上の公式があるが,日本語には本格的なものがない。ソフトウエア完成までの過程として,本研究が該当する2年間では,リーダビリティー公式を構築するための変数を決定することが具体的な目標である。 変数を決定するには文章理解の2要因であるテキスト要因と読み手要因の関係を明らかにすることが必要であり,テキスト要因から変数を決定するには日本語が他の言語と異なる特徴を明らかにする必要がある。そこで本研究では日本語の文章の特徴として,(1)文字種が複数ある(漢字,平仮名,カタカナ,ローマ字),(2)語種が複数ある(漢語,和語,外来語,混種語)という2点,作業記憶研究の知見から(3)1文の長さ,認知心理学の文章理解研究の知見から(4)命題による1文の情報量の2点を加え,さらに(5)文構造の複雑さの5つの変数があると考えた。 リーダビリティー公式を構築するためには,(1)学年で示す方法,(2)ポイント数で示す方法,(3)グラフで示す方法の3種類があるが,まず(1)の方法を採用することにし,小学1年から高校3年までの12学年の国語教科書から散文だけを取り出し,電子ファイル化しコーパスを作成した。テキスト要因から(1)平仮名の割合,(2)漢語の割合,(3)1文の平均文字数,(4)1文の平均語数,(5)1文の平均述語数,(6)1文の平均文節数を予測変数とし,学年を従属変数として線形回帰分析(ステップワイズ法)で分析したところ,(3),(4),(6)は除外され,(1),(2),(5)で以下の公式ができた。 学年=-0.07*総平仮名数/総文字数+0.004*総IU数/総文数+0.047*総漢語数/内容語の総数+7.341 平成19年6月27日に特許出願を行なった。
|