従来、人手で行ってきたSSM職業コーディングをコンピュータで支援させるためには、用語が担う「意味内容」を可能な限りコンピュータの理解できる「形式」に置き換える必要がある。今年度は実際のSSM職業データを用いて、回答の内容を分析した。以下、具体的に述べる。 1.1995年SSM調査委員会の好意により入手可能となった1965年データ(東京地区)について、全サンプルの入力を完了した。 2.上記データのうち、先に入力していた1/4については、回答の形態や出現する用語の傾向を分析した。 3.この結果を、カテゴリーの説明書である『SSM職業分類(改訂判)』における記載内容と比較し、対応辞書の作成に向けて両者の関連を部分的に明らかにした。 今後は、全サンプルについて同様の分析を行って基本的な戦略を立てる。さらに可能ならば、最新版(1995年)データの利用許可を得て分析し、精度を上げていきたい。
|