研究分担者 |
野山 嘉正 東京大学, 文学部, 教授 (20011330)
久保田 淳 東京大学, 文学部, 教授 (40011316)
安永 尚志 国文学研究資料館, 研究情報部, 教授 (20017411)
松野 陽一 国文学研究資料館, 文献資料部, 教授 (50005823)
新井 栄蔵 国文学研究資料館, 研究情報部, 教授 (90111070)
|
研究概要 |
コンピュ-タ用ユ-ザ辞書拡張のための国文学研究語彙の調査研究とその収集を目的とする本研究は、その対象を古典から近代にわたる研究語彙のうち、作品名・人物名・地名などの固有名を除く、組成の比較的簡単な一般語彙の収集に定めて実施された。 2年間の研究期間で、調査研究のために、国文学研究の前線から組織された研究者は、研究代表者1名、研究分担者28名、研究協力者72名(計101名)に達し、この他動員されたアルバイト員を含めると、延べ120名になる。平成2年度には、当館によって作成された基礎資料に基づき、北海道地域から九州地域まで8地域16班(各班3名)の研究協力者が、予め策定された16の調査研究領域における一般語彙の収集と取捨選択に当たり、平成3年度には同8地域8班(各班3名)の研究協力者によって、前年度までに集積された一般語彙に基づいて、その取捨選択と未開拓の8研究領域における収集に当たった。 2年間にわたる調査研究の結果、収集した一般項目は、古典約10,000項目、近代約7,000項目に達した(研究報告書にその一覧を載せた)。また、コンピュ-タ辞書として活用するための付加情報として、それぞれの一般項目における漢字列異表記、訓みに当たるカナ列異表記、使用される時代区分の認定、類想概念を付加した。 17,000という項目数自体、当初の予想をかなり上回る成果であり、今後、更に追加されるべき項目を見込むと将来的には一般項目だけで20,000項目に達すると思われる、また類想概念は1項目につき平均8語、延べ135,000語が付加されている。更に未収集の固有名などを加えた場合、総デ-タ数は20万を超えることが予想され、そのシソ-ラス容量の問題も含め、コンピュ-タの容量の問題及びコンピュ-タ用語としての階層化の問題が今後の重要な課題となろう。
|