Research Abstract |
昨年度は,大規模語彙調査を実施し,語彙使用頻度表を作成した。本年度は,昨年度の研究で得られた語彙使用頻度表を計量的に分析し,日本語における文字や語彙の使用実態を明らかにした。そして,本研究の全体的な総括を行った。本年度の研究成果は,次の通りである。 1.漢字の頻度特性の分析 電子メディアを対象として,漢字熟語や基本漢字500字,学年別漢字配当表に掲載されている漢字の使用頻度特性を分析した。その結果,(1)基本漢字500字および学年別漢字配当表を習得すれば,それぞれ,70.41%,89.84%の割合で,新聞に出現する漢字をカバーできること,(2)新聞での使用頻度が高い漢字であっても,学年別漢字配当表には掲載されていない漢字が数多く存在すること,(3)ある特定の熟語にしか使用されない特別な漢字が存在すること,などが明らかになった。 2.構造別漢字データベースの構築 字形の構造に着目して,漢字の部首の機能的関係を掲載したデータベースを開発した。その特徴は,(1)使用頻度の高い漢字500字をデータベース化したこと,(2)使用頻度データを参照すれば,よく使用される漢字を優先的に検索できること,(3)部首などに基づいて,9種類に構造を分類したこと,などである。このデータベースを用いて,教材開発を行えば,漢字の構造的分類も容易となり,有用な教材が得られる。一般に,漢和辞典は紙媒体であるため,検索時間が長くなること,市販されている電子化辞書はプロテクトが施されていることが多く,教材開発での自由な使用が困難であることなどの問題点が指摘されている。本研究により,これらの問題点が解決された。 こうして得られた研究成果は,テキストデータにおける日本語の使用実態を明らかにしたものであり,数科書を電子化し,日本語テキストを含む教材をネットワーク配信する際に生じる諸問題を考察する上で,大変有用な資料となる。
|