2001 Fiscal Year Annual Research Report

電子メディアを用いた大規模語彙調査と教科書電子化への応用

Research Project

Project/Area Number	12780126
Research Institution	Aichi University of Education
Principal Investigator	野崎浩成愛知教育大学, 教育学部, 助教授 (80275148)
Keywords	語彙調査 / 電子メディア / コーパス / 文字フォント / JIS外漢字 / 形態素解析 / テキストデータベース / 教科書
Research Abstract	昨年度は,大規模語彙調査を実施し,語彙使用頻度表を作成した。本年度は,昨年度の研究で得られた語彙使用頻度表を計量的に分析し,日本語における文字や語彙の使用実態を明らかにした。そして,本研究の全体的な総括を行った。本年度の研究成果は,次の通りである。 1.漢字の頻度特性の分析電子メディアを対象として,漢字熟語や基本漢字500字,学年別漢字配当表に掲載されている漢字の使用頻度特性を分析した。その結果,(1)基本漢字500字および学年別漢字配当表を習得すれば,それぞれ,70.41%,89.84%の割合で,新聞に出現する漢字をカバーできること,(2)新聞での使用頻度が高い漢字であっても,学年別漢字配当表には掲載されていない漢字が数多く存在すること,(3)ある特定の熟語にしか使用されない特別な漢字が存在すること,などが明らかになった。 2.構造別漢字データベースの構築字形の構造に着目して,漢字の部首の機能的関係を掲載したデータベースを開発した。その特徴は,(1)使用頻度の高い漢字500字をデータベース化したこと,(2)使用頻度データを参照すれば,よく使用される漢字を優先的に検索できること,(3)部首などに基づいて,9種類に構造を分類したこと,などである。このデータベースを用いて,教材開発を行えば,漢字の構造的分類も容易となり,有用な教材が得られる。一般に,漢和辞典は紙媒体であるため,検索時間が長くなること,市販されている電子化辞書はプロテクトが施されていることが多く,教材開発での自由な使用が困難であることなどの問題点が指摘されている。本研究により,これらの問題点が解決された。こうして得られた研究成果は,テキストデータにおける日本語の使用実態を明らかにしたものであり,数科書を電子化し,日本語テキストを含む教材をネットワーク配信する際に生じる諸問題を考察する上で,大変有用な資料となる。

Research Products
(4 results)

All Publications (4 results)

[Publications] 野崎浩成: "漢字2字熟語の頻度特性に関する分析"日本教育工学会誌. 25,(Suppl.). 59-62 (2001)
[Publications] 野崎浩成: "JIS外漢字の電子化手法と教材開発への応用"愛知教育大学研究報告(教育科学). 第49輯. 175-178 (2000)
[Publications] 野崎浩成: "電子メディアを対象とした日本語テキストデータ処理"教育システム情報学会誌. Vol.16, No.3. 181-182 (1999)
[Publications] 近松暢子: "A Japanese logographic character frequency list for cognitive science research"Behavior Research Methods, Instruments, & Computers. Vol.32, No.3. 482-500 (2000)