研究概要 |
文字種研究用のサンプルデータの分析(一次)を,絵画・彫刻・書跡・工芸・考古学の各分野について「文化財に関する直接的な情報」およそ244万字と,絵画の分野について「文化財研究に必要な史料」およそ34万字について実施し,さらに絵画・彫刻・書跡の分野について「文化財に関する論考」およそ36万字分のサンプルデータを作成して次年度の作業に備えた。サンプルデータおよそ279万字の一次分析から,JIS第一水準・第二水準(JIS X 0208)に含まれない漢字1,262種を抽出した。その内,JIS補助漢字(JIS X 0212)に含まれる字種が838種,含まれない字種が424種である。 サンプルデータの分析作業と並行して,工業技術院の担当者に対する面接調査と,情報処理業界の動向についての文献による調査を行った。その結果,現時点でUNIXの日本語環境共通規約においては補助漢字を含めたJIS漢字符号のセットが異ソフトウエア間・異機種間においても交換可能性が保証されていること,また国際標準化機構(ISO)において中国・韓国等を含めた一元的な漢字コード体系の国際的な制定作業(DIS,通称「ユニコード」)が進んでいること,さらに,次世代OSの中にはその国際標準コード体系のサポートを表明しているもの(WindowsNT)が既に存在することなどが判明した。 この調査の結果,研究方法を若干変更し,JISの3つの区分以外に,ユニコードを加えた4つの区分において充足率を分析することとした。
|