研究概要 |
国文学研究に固有な研究語彙(研究用語)のうちの一般語彙を網羅的に収集し、その同義語や連想語を階層化させて搭載し、電子化辞書として形成することを目的として行われた本研究の実績として、基準語にして約41,000件のデータが得られた。各レコードは、1.基準かな 2.基準漢字3.異表記かな 4.ローマ字 5.英語 6.時代 7.同義語1〔異表記漢字列〕 8.同義語2〔通常同義語とみなされるもの〕 9.連想1〔使用ジャンル〕10.連想2〔連想される具体例〕11.連想3〔通常の連想概念〕の11項目からなる。同義語、連想語等を含めたのべ総語彙数は、概数60万語である。(すべての項目に当該語があるとは限らず、また、連想語列には平均7から8近くの語彙が登録されている)。これをA4版の用紙にプリントアウトした場合、4,000ページ弱に達した。これらは現在CD-ROM版に電子化辞書として搭載している。 ただし、上記約41,000件には、対象とした基準語彙が当初6万件という膨大なものであったことや、研究経費や時間等の物理的な制約があって、残念ながら最終的な点検や監修をくぐらせることができずに未整備のまま終わったものが1万近く含まれている。公開までには、そのような傷をなくすとともに、さらに全体にわたって、各時代、各分野の専門の研究者による総監修の手を経なければならない。 本研究によって、(1)英語化が必ずしもすべて可能ではないこと。(2)同義語列もすべての語彙に対してあり得るとは限らず、何を同義語と認めるかは、研究者によって区々であること。(3)連想1列の使用ジャンルは、日本語全体の分類概念を体系化した上でなければ、厳密には決められないこと。(4)連想3の収集範囲は多様であり、固有名も入るなど、精粗はまちまちであることなどの知見が得られた。
|