研究概要 |
コンピュータを用いて古典文献研究を効率的に行うには、扱いやすい文字処理体系が不可欠である。しかし、現状では、各分野によってことなる文字処理体系が独自に選択あるいは開発され、互換性のないままに運用されており、このことが古典学所領域の相互連携を大きく阻害している。この問題を解決するには、研究者間での文献データ共有を可能ならしめる普遍的なデジタルコード体系が必要となってくる。 今年度、この体系の可能性について検討を行い、文字コードシステムの乱立を抜本的に解決する方法として、バイト数による従来の固定した通し番号ではなく、文字に「学名」を付けて処理する方式を試験的に開発した。この方法は動植物の学名にヒントを得たものである。また、この方式に基づいてサンプルデータを作成し(電子テキスト入力)、このデータを用いて「学名方式文字コードシステム」のデモンストレーションを行った。(サンプルデータを用いたデモンストレーション) 従来の常識を破るこの方式は、情報工学系研究者の発想の限界を人文系の発想で乗り越えようとする点に特色がある。本研究成果の中核を成す中間的文字コード変換等のプログラム(GSCSm.tar.gzに圧縮)とそれを補完する膨大な「文字定義ファイル」は、http://www.dd.iij4u.or.jp/naochan/GSCSに掲載したが、今後、これらをオープンソースのソフトウエアとして公開し諸研究者の批判を仰ぎたい。(中間的文字コード変換プログラムの試作) 「情報処理」調整班と共同で、XML,HGML形式変換プログラムの開発作業を行った。(インターネットを用いた文献データ交換のための情報サービス技術の開発)
|