研究概要 |
平成18年度にリストアップした日本語定義語彙に採用する語の候補語について,以下の分析・検討を行った. 1.候補語のランク付け手法の評価 岩波国語辞典(第五版)の見出し語と語釈文中の語の関係を表したグラフをもとに固有ベクトルを求めることによりランク付けを行ったが,本手法では未登録語(語釈文中のみに出現し見出し語として登録されていない語)のランクが比較的高くなることが分かった. 2. 日本語教育用基本語彙との比較 中央教育研究所や国立国語研究所が選定した児童(小中学生)や外国人向けの教育用基本語彙と比較した.語釈文ではあまり使われない口語的表現(「お婆さん」,「勿論」)や逆接の接続詞(「ところが」)などのランクが低く,文法的説明に使われる語(「転じる」,「用法」,「略」などのランクが高くなることが分かった. 3. 日本語定義語彙の選定 未登録語の影響を考慮し,上位15000語の中から5853語を定義語彙として選定した.岩波国語辞典の見出し語の約26.5%はこの語彙のみで記述されている一方,約8.4%は語彙外の語を5語以上含むことが分かった. 4.定義語彙による語釈文記述の検討 語彙外の語を使用して語釈文が記述されている語については書き換えが必要であるが,一般的な日本語国語辞書は百科事典的な特性を持ち,専門的な表現も多く,単なる語の置き換えや削除だけでは対応できない.また,「目をつける」などのような慣用表現の問題もある. LongmanやOxfordなどの英語辞書を参考に,定義語彙による語釈文記述の方法について検討した.
|