Research Abstract |
本研究では,まず,日本語教育用辞書の用例を数量的に解析し,適切な用例の特徴を明らかにし,次に,用例のない単語に用例を付ける試みを行った。 具体的には,日本語教育用として利用されている「基礎日本語学習辞典(国際交流基金編 凡人社)」の中に掲載されている用例(6427個)を分析した。この辞典は,見出し語全体に対する用例付きの見出し語の割合(これを用例充足率と呼ぶ。)が,90%を越えており,非常に高い値である。また,この辞典では,1つの見出し語に対して,平均2個以上の用例がある。この辞典の用例全体の単語数(句読点等の記号も1つの単語として数える。)は,約6万5千個で,1つの用例は平均10単語(最小2,最大48)である。また,用例全体の異なり単語数(語彙数)は,約6千個である。用例の文字数は,平均20文字で,文字の種類については,(1)ひらがな,(2)漢字,(3)記号等,(4)カタカナ,(5)数字の順である。 次に,この辞典の中に用例のない単語が210語あり,これらの単語に用例を付ける試みを行った。その結果,既存の用例を他の単語の用例として再利用する方法では,約40%の単語に用例が付いた。そして,教材テキストデータベース(新書等の本49冊の中の文(約10万弱)から,用例を探す方法では,98%の単語に用例候補が見つかった。
|