今年度は以下の内容についての研究を行った。 1.社会科学、特に社会調査によって得らえるデータとメタデータのための、現在提案されている電子的記述方法をサーベイした。以下の点が重要と思われる。 ・様々な構成要素を持つデータに適応した記述フォーマットとしては、XMLが最も有望である。特に、ここ1〜2年の間にXMLの仕様と編集および利用のためのソフトウェア環境が急速に整備された。 ・しかしながら、XMLはデータの量が膨大である場合、特に数値データの表現については効率が悪い。大量の数値データを取り扱う場合には、従来型のデータフォーマットによって補完される必要がある。 ・サーベイデータのための記述方式としては、米国ミシガン大学にあるICPSRに活動の中心をおいているDDI(Data Documentation Initiative)によって提案されている方法が、英語圏およびヨーロッパの社会科学研究者の標準として広まりつつある。 ・DDIに準拠した社会科学データのネットワーク上での共有のための先駆的な研究は、ヨーロッパのNESSTARによって行われている。 2.XMLによって表現されたデータを取り扱うためのソフトウェア環境について調査し、今後の分析システム開発の基盤を選択するための情報を得た。 ・数種類のXMLパーザが無償で公開されているが、これらで提供されるライブラリを用いて分析システムを作成するのは、かなりの労力と時間が必要となる。Rシステム用には、AT&Tの研究所で開発された実験的XMLパーザが公開されている。高機能な統計システムにこの機能が組みこまれているため、比較的容易にデータ処理機能を作成することが可能であり、処理効率の問題を除けば、有望な方法と思われる。
|