1993 Fiscal Year Annual Research Report
Project/Area Number |
04451126
|
Research Institution | Tokyo National Museum |
Principal Investigator |
高見沢 明雄 東京国立博物館, 資料部, 情報管理研究室長 (90150036)
|
Co-Investigator(Kenkyū-buntansha) |
横溝 廣子 東京国立博物館, 資料部, 資料第三研究室研究員 (90205229)
|
Keywords | 文化財情報 / 漢字情報処理 / JIS X 0212-1990 / ISO10646-1993 |
Research Abstract |
本年度は研究の最終年度に当たるため,研究成果の取りまとめを主眼に研究を進めた。 昨年度作成した「文化財に関する論考」のサンプルデータ約36万字について新たに一次分析を行ない,JIS第一水準・第二水準漢字(JIS X 0208)に含まれない漢字160種を抽出した。 上記結果を昨年度の「文化財に関する直接的な情報」及び「文化財研究に必要な史料」の一次分析結果と合わせ,同一字種について統合・集計した。 上記作業時点ではISOの規定はドラフト段階のものを使用したが,その後正式報告書がUCS(ISO10646-1:1993)として刊行されたため,これを入手し,ドラフトとの比較を行なった。比較の結果,一部字形の入れ替えやかなりのコードの変更が行われていたため,上記作業結果のISOコード修正作業を行なった。 以上の作業結果を統計処理して得た漢字使用頻度の各文字区分ごとの充足率は,JIS第一水準・第二水準漢字(JIS X 0208)だけで99.71パーセント,これにJIS補助漢字(JIS X 0212)を加えると99.94パーセント,UCS(ISO10646-1)では99.96パーセントであった。ただしこの数値は比率としてはかなり高いものの,「〓」(はぞう)や「〓」(しころ)など,文化財に関する記述で比較的多く出現する幾つかの文字を欠いており,文化財の分野特有の文字を利用者定義文字(いわゆる「外字」)として用意することが必要であるとの結論に達した。 利用者定義文字による方法の実用性を確認するために,本研究の「研究成果報告書」(冊子体)の印刷を,必要な文字全てを利用者定義文字として作成し,コードを割り当て,印字可能な環境を試作し,その印字出力を原稿として印刷する方法で行なった。
|