研究概要 |
国文学という学問領域における研究語彙を収集・階層化して、将来において国文学言語地図を総体として作成するための基盤用に、本年度は国文学研究語彙第一次電子化辞書の基礎モデルを設計し、これを完成した。1基本語彙に対するデータ仕様は次の項目からなる。 基準カナ・基準漢字・異表記カナ・時代別・ローマ字表記・英語・同義語列1(異表記漢字に相当)・同義語列2(一般的に同義語として認定できるもの)・連想語彙列1(主として使用ジャンル)・連想語彙列2(主として具体例)・連想語彙列3(関連する周辺語彙) 作成したこの第一次電子化辞書基礎モデルには、とりあえず研究語彙の基準漢字分を約17,000件搭載した。ここに搭載したデータは、基準漢字と基準かな、連想概念列のみであり、階層化した上記データ仕様の項目をすべて満たしていない。この基礎データに対し、ローマ字・英語表記を除いた他のすべての階層化項目を満たすことが当初の目的であるが、第一次電子化辞書基礎モデルの作成が年度末近くまでずれこんだこと、また研究初年度ということもあって動員した入力要員(大学院生)の手配が遅れ、またその力量にバラつきがあり、実質的にデータの階層化に際してのふわけ作業に予想外の困難が伴ったため、今年度の目標10,000件に対し、残念ながら現段階では計2,000件ほどの階層化に留まらざるを得なかった。 残り2年間において残余分15,000件を整備するとともに、基準語彙をさらに拡張して、最終的に60,000件近い基準語彙とその階層化データを搭載し、将来の国文学言語地図の作成を睨んでのデータベース化を果たす予定である。
|